Evolución de la Grabación y Compresión de Vídeo Digital

Evolución de la Grabación y Compresión de Vídeo Digital

Grabación de Vídeo

Inicialmente, la experiencia en grabación de sonido sobre cinta magnética se aplicó al vídeo, pero surgieron problemas al grabar señales de alta frecuencia. Para resolver esto, se movieron las cabezas de reproducción y grabación a alta velocidad con un movimiento lento de cinta.

Exploración Helicoidal

Se utilizan entre una y cuatro cabezas sobre un tambor rotatorio, que graba de forma oblicua respecto al plano de avance de la película. Un magnetoscopio analógico podía grabar información de un campo de televisión completo en cada pista de vídeo inscrita de esta forma. En los magnetoscopios digitales, la información de cada campo requiere un espacio mayor, ocupando doce pistas consecutivas sobre la cinta.

Grabación en Alta Densidad

Para evitar la magnetización de una pista que afecte a la lateral, se colocaban zonas de seguridad sin información entre las pistas de información. Esto provocaba desperdicio de cinta, que se solucionó modificando el ángulo de grabación y aplicando un desplazamiento secuencial de fase para el croma, eliminando señales que interfieren.

Clasificación de los Formatos Analógicos

  • VHS: Desarrollado por JVC en 1978, sistema doméstico.
  • S-VHS: Mayores frecuencias de luminancia para el sincronismo y el pico de blanco que el anterior.
  • BETACAM: Por SONY en 1981, procesa en Y R-Y,B-Y.

Digitalización de la Señal

La señal analógica era continua y pasó a ser discontinua, escalonada en digital.

Cuantización

A cada muestra se le asigna un valor que representa la amplitud de ese sample. La amplitud total se divide en tantos escalones como la resolución en Bits lo permita, según la fórmula 2 elevado a n, siendo n la cantidad de Bits. Cuanto más cantidad de bits, más valores intermedios, lo que hace que los escalones sean más pequeños y la onda digitalizada más parecida a la señal original.

Frecuencia de Muestreo

Entre dos muestras hay puntos intermedios de señal original que se perderán, por eso cuanto mayor Sample Rate, más parecido al original.

Teorema de Nyquist

Para representar digitalmente una frecuencia, necesitamos al menos 2 muestras, una para la amplitud positiva y otra para la negativa. Para representar digitalmente una señal que contiene componentes de frecuencia hasta x hz, es necesario usar una Frecuencia de Muestreo de, al menos, el doble de muestras por segundo.

Aliasing

Si hay frecuencias mayores a Nyquist al muestrearse, se tomarán valores erróneos que no representarán fielmente a la frecuencia original y se traducirán en un sonido más grave que no existía, un alias. Para evitar esto, antes de muestrear se filtrará la señal con un filtro pasa bajos llamado Antialiasing, cuya frecuencia de corte será igual a la frecuencia de Nyquist, para rechazar todas las frecuencias que no pueden ser muestreadas.

Proceso de Muestreo

  1. Señal analógica filtrada con el filtro antialias
  2. Se mide la amplitud instantánea de la señal a intervalos de tiempo iguales
  3. El cuantizador convierte cada medición en valor numérico.

La señal de vídeo está compuesta de luminancia y crominancia, sonido y otras señales de control, por lo que hay que codificar cada una de esas señales.

Codificación ITU.R BT 601

Para codificar digitalmente, se utiliza la forma de codificar la luminancia osea se extrae de la fórmula Y. Con el color no pasa lo mismo, para conseguir que ocupen menos de 1 voltio se utiliza CR=0,713 (R-Y) Y CB= 0,564 (B-Y).

PARÁMETROS

  • Señales codificadas Y, CR (R-Y), CB (B-Y)
  • Frecuencia de muestreo 13,5 MZ para 6,75 MHZ para CR, CB
  • Periodo de muestreo 74 NS
  • Estructura de muestreo ortogonal
  • Muestras por línea 625 luminancia, 864 en 525 luminancia, 864 crominancia, 532
  • Muestras activas luminancia 720 y crominancia 360
  • Codificación sistema PCM de 8 bits por muestra con cuantificación lineal
  • Niveles de cuantificación reservados de 0 al 16 y del 235 al 255.

Codificación ITU-R BT 709

Para codificar HD, cambian las dos fórmulas: Luminancia Y=0,2126R + 0,7152+0,0722B y las de diferencia de color Pb= (B-Y)/18556 y Pr=(R-Y)/15748.

Necesidad de Compresión

La información pura de vídeo digital puro es enorme, tanto en HD como en SD hay que comprimir. En 4:4:4 1 segundo 248,8 MB. Para eliminar información aprovechamos:

  • Redundancia temporal del audio
  • Características de la visión y audición.
  • Redundancia espacial (intraframe): interior a cada fotograma, continuidad en los objetos, codificación de un valor representativo y diferencias, codificación de longitudes de recorrido (RLC).
  • Redundancia temporal (interframe): continuidad en la acción, similitud entre fotogramas consecutivos, codificación DPCM.

Estándares por Comisiones Internacionales

Motion-JPEG

Trata cada campo de una secuencia de forma diferente. Obtiene una reducción del 20:1. Hay dos variantes: A obtiene ficheros más pequeños y B que tiene más calidad.

BENEFICIOS:

  • Modificaciones precisas en un editor de vídeo
  • Podemos empezar a reproducir en cualquier cuadro

INCONVENIENTES:

  • Al no usar redundancia Inter-Frame, la compresión da ficheros largos.

H261

Estandar en video conferencias, opera sobre imágenes no entrelazadas, codifica en modo YCbCr y soporta como resoluciones de los formatos CIF y QCIF. Las redundancias espaciales se reducen mediante transformación basada en DCT  y la correlacion temporal mediante codificación predictiva del movimiento. Permite utilizar métodos de compresión intraframe donde se codifican bloques de 8×8 pixels de cada imagen con ellos mismos. Tambien puede funcionar en modo interframe donde se codifican los cuadros con respecto a uno de referencia y que desarrollaremos en la codificación mpeg.

MPEG  Movin picture experts group aplica a la codificación de señales de video se basa en la agrupación de un número de imágenes juntas que denominaremos GOP. Al principio del proceso de compresión en MPEG, el I es codificado. Este fotograma esta completo y sin comprimir por lo que se muestra sin ninguna degradación. Dentro de este grupo de imágenes asociadas con este fotograma I existen fotogramas P que no pueden existir sin este fotograma. Después hay unos fotogramas B intercalados entre los fotogramas I y P, que están ensamblados por la información digital interpolada de sus fotograma I Y P más cercanos. Solo los fotogramas l llevan información completa de una imagen.

I: intracuadro se codifican independientemente de las demás, sin otra refencia que la del propio cuadro. Al menos hay uno cada 10 o 15 frames, están comprimidos con un algoritmo al estilo de JPEG de forma intraframe con DCT, se utilizan como puntos de acceso aleatorio a la secuencia, también se les llama cuadros clave.

P: predictiva resultado de predicciones de imágenes I o P previas en la secuencia. Realiza una ordicción del movimiento, hacen uso de codificaciones interframes, en las cuales se realiza un estimación, de movimiento y se codifican mediante DCT las diferencia obtenidas.

B: Bidireccionales resultado de predicciones de la imágenes mas cercanas I o P previas o posteriores en la secuencia. Bidireccional y relativa a otras I o P. No se pueden utilizar nunca como referencia de otros frames. Generan mejor compresión.

DC-coded: intraframe, para comprsion sin perdida.

MPEG-1 Año 1991 Video en CD ROM, resolución 352×240, los famosos archivos de audioMP3 no son MPEG-3, sino MPEG-1 y están definidos en la tercera parte de especificación.

MPEG-2 Año 1994 usado para codificar audio y video para señales de transmisión TDT, satelitie y cable en SD. También para DVDs. Permite usar secuencias entrelazadas. Comprime tanto por GOP como por DCT.

MPEG-3 Propuesta de están para la TV de alta resolución, pero como se ha demostrado que MPEG-2 con mayor ancho de banda cumple con este cometido se abandono.

MPEG-4 Año 1999 Usado para codificar audio y video para señales de transmisión en HD, datos de audiovisuales para la web y videoconferencia por móviles.

MPEG-7 2001 además de contenido audiovisual incluye XML con metadatos para favorecer la interacción con el contendio audiovisual y la descripción de contenidos.

MPEG-21 2001 intenta solucionar problemas de hoy en día con la distribución de contenidos digitales. Pretende proteger derechos de autor la copia y la distribución.

MPEG_4 (Divx) Basado en el estandan MPEG-4 Este códec permite comprimir un video usando algoritmos de compresión con pérdida. No obstante, la pérdida de calidad en el proceso de compresión suele ser mínima si se siguen las técnicas adecuadas, por lo que nos permite comprimir una película DVD en 1 o 2 CD con buena calidad. Surgio a partir del hackeo del código de Microsoft que permitia incluir video MPEG-4 bajo su propio contenedor ASF, pudiendo entonces ser incluido en otros contenedore como AVI.

MPEG_4 (XviD) es un códec de video gratuito y de código abierto, desarrollado por programadores de todo el mundo, que cumple el estándar MPEG-4 ASP. Trabaja realizando compresiones con perdida, afortunadamente utilizando un buen programa de compresión y las configuraciónes adecuadas, esta perdida llega a ser indistinguible y permite comprimir una película DVD al tamaño de un CD con una calidad similar.

MPEG_4 (X264) gratuito y libre para comprimir pistas de video utilizando el estándar H 264 AVC. Existen varias implementaciones de este estándar Apple tiene una, Nero otra Microsoft. Se utiliza frecuentemente en muchos contenedores actuales con una calidad excelente. Es también conocido por ser el formato utilizado en los Blu-ray.

H265 Ha sido aprobado por el MPEG y mejora los ratios de comprsion del H264 aparentemente sin perdida de calidad.

–Formatos contenedores

Estos archivos tienen en su interior varios elementos

AVI es uno de los más conocidos, fue desarrollado en 1992 por Microsoft.

MOV desarrollado por Apple, practico para la edicción, porque puede importar y editar sin copia previa.

MP4 especificado como parte del estándar internacional ISO/IEC MPEG-4. Permite streaming de contenido bajo demanda por internet.

Matroska apunta a ser el estándar para los formatos contenedores multimedia. Incorpora las características mas importantes de un formato contenedor moderno. Rápida búsqueda dentro del archivo, alta recuperación de errores, entradas para capítulos, multiples pistas de subtitulos y audio, streaming a través de internet, menus estulo DVD.

Advanced Systems Format ASF es el formato propietario de Microfoft para audio y video diseñador para transmisión de internet bajo demanda

Real Media creado por RealNetworks. Normalmente se usa en conjunto con formatos RealVideo y RealAudio para stereamin de contenidos por internet.

–Clasificacion de los gabadores digitales

Sistemas abiertos fabricante desea que sea implantado por otros fabricantes lo registra en SMPTE y la EBU para que promocienen las características del sistema.

Sistemas propietarios Cuando la compañía creadora de un formato desea ser el único fabricante de equipos del mismo.

Muestreo 4:2:2 Mitad de color (horizontal) brillo igual Ejemplos DVCPRO 50 (Panasonic), DVCPRO HD( Panasonic) Betacam SX (Sony), grabadora de isco digital D-1, D-5

Canal y 13,5 MHz canales U y V 6,75MHz con 8 bits/muestra.

Muestreo 4:2:0 explora los colores en líneas alternas en una coje rojo y en la siguiente azul, reduce el color a una cuarta parte ya que lo hace en horizontal y vertical. Ejemplos DVCAM, DVCPro, MiniDV (PAL) D-8 (PAL).

Muestreo 4:1:1 las muestras de crominancia son tomadas una vez cada cuatro muestras horizontales de luminancia. Ejemplos DVCPRO25 (Panasonic).

Muestreo 4:0:0 si la imagen estaba en blanco y negro puede eliminarse por completo la información de color Ejemplo DV (video digital PAL), mini DV, DVDCAM, DVCPro, D-8.