Esa guía de DVD
DVD-VIDEO
MPGE2
A la hora de ponernos a codificar para DVD debemos tener presente cuál es la fuente que vamos codificar, cuál va a ser su salida (NTSC ó PAL), el tamaño total y su tasa (esto dos procesos se explican en la sección de crear un DVD).
Si partimos de celuloide (cuya tasa era de 24 fps) debemos pasar la película por un proceso llamado telequinado para tener esa información digitalmente y luego codificarla en un codificador MPEG-2. Para NTSC debemos obtener 30 fps y 25 fps para PAL, existen una serie de procesos definidos para convertir de un formato a otro, siendo el más complejo el de cine a NTSC en que se usa una técnica llamada 3:2 pulldown.
Los fabricantes de DVD no están obligados a que sus aparatos reproduzcan DVD en NTSC y PAL, sin embargo en la práctica la mayoría de reproductores PAL son capaces de reproducir NTSC, pero no a la inversa, por ello si hacemos un DVD con una sola edición y queremos que se vea en prácticamente todo el planeta, debemos codificarlo en NTSC. Tanto en el DVD-Video como en el reproductor deben venir la norma en que están codificados y la norma o normas que son capaces de reproducir, respectivamente.
La resoluciones posibles para codificar MPEG-2 son (la primera es la empleada para películas)
- NTSC: 704x480,352x480,352x240,352x576
- PAL: 720x576,704x576,720x480,352x288
Tanto si hemos codificado la imagen en formato entrelazado (cada imagen está compuesta por dos campos) como progresivo (cada imagen es un cuadro completo), a la hora de la reproducción, ésta se hará en formato entrelazado.
Tanto las televisiones como monitores de ordenador adoptan el formato o aspecto de 4:3 es decir su longitud horizontal dividida entre la vertical da siempre un resultado de 1.3333. Pero el cine es un formato de pantalla ancha (widescreen) con relaciones que llegan a 1.85 o incluso 2.35. Cuando se estaba definiendo el DVD se hizo un esfuerzo para acercar las televisiones al cine y se creó el aspecto 16:9, que si bien no es igual al del de la mayoría de películas, sí se acerca lo suficiente:16:9=1.78, cine (normalmente)=1.85 ó 2.35.
La forma de tener una película en formato panorámico 16:9 no es, como pudiera parecer, tener más píxeles en horizontal. Para PAL se siguen teniendo los mismos 720x576 píxeles pero cada el aspecto de cada píxel es mucho más horizontal. Este forma se conoce como imagen anamórfica. A la hora de representar una imagen anamórfica en una pantalla 4:3, esta se vería con las formas muy alargadas. La forma de evitar esto es usar el letterbox (se introducen unas bandas negras arriba y abajo de la pantalla para que la zona activa de imagen entre ellas tenga la proporción 16:9) ó el pan and scan (se selecciona la zona de la imagen que contiene más información, se centra y se descarta el trozo de imagen que no se ve, al codificar se deben indicar en el MPEG2 los vectores de pan and scan). Por supuesto en una pantalla 16:9 la imagen se verá a pantalla completa sin ninguna pérdida. Aquí debemos indicar o configurar tanto los datos del stream MPEG2, como el reproductor, como la televisión. Algunos títulos vienen con una relación de 2.35:1, en una pantalla panorámica introducirá unas pequeñas bandas superiores, en una 4:3 estas bandas serán muy grandes y se puede perder algo de imagen por los laterales.
MPEG-2 realiza tanto una compresión espacial (dentro de cada fotograma, a partir de ahora, intra-frame) como temporal (redundancia entre varios fotogramas, a partir de ahora inter-frame). Básicamente la compresión intraframe consiste en dividir la imagen en celdas, de tal manera que aquellas que tienen un color común, sólo se digitalice ese color una vez y en las celdillas en que va. Si bajamos la calidad de la codificación tendremos al final menor tasa de datos pero podemos perder calidad, ya que se puede asignar a colores que son muy parecidos en la fuente el mismo color final. Con una buena codificación no debería haber pérdida apreciable de calidad, las escenas en las que mayores problemas de codificación suele haber son aquellas con grandes zonas de un mismo color, como partidos de fútbol (verde) o títulos de crédito (negro), mientras que en imágenes del mundo real con una gran variedad cromática se puede realizar un gran ahorro de datos sin dejar de tener la calidad requerida.
El siguiente paso es la codificación interframe. En una secuencia es usual tener uno o varios objetos que permanecen fijos y otros que varían su posición, si sólo codificamos los cambios habremos ganado mucho espacio; por ejemplo, tenemos a una persona que levanta el brazo, no necesitamos codificar toda la persona en todos fotogramas, sino la persona en el primer fotograma y en los siguientes sólo el brazo con sus variaciones y así luego poder reconstruir la escena. Por esto las escenas más complicadas de codificar son aquellas con muchas acción y movimiento (muchos cambios), mientras que en un escena más estática como un paisaje se puede realizar una gran compresión. Es debido a esta forma de compresión por lo que el MPEG2 no es un formato adecuado para la edición, podemos colocarnos en un fotograma del que no tenemos toda la información, por tanto la compresión en MPEG2 SIEMPRE debe ser el último paso en el tratamiento del vídeo.
Un stream (cadena de datos) normal de MPEG2 contiene normalmente tres tipos de imágenes (I, B y P). Las imágenes I (Intra) se codifican sólo con técnicas intraframe, tienen información de toda la imagen. Las imágenes P (Predictivas) llevan además compresión interframe, tienen menos información, se basan en otras imágenes P y en las I para ser reconstruidas. Las imágenes B (bidireccional) guardan todavía menos información y se reconstruyen basándose en el anterior y siguiente fotogramas. La más pequeña unidad de DVD-Video a la que nos podemos referir es un GOP (Group Of Pictures), encabezada siempre por un frame I. MPEG soporta el uso de diferentes tamaños de GOP en un mismo stream (open GOPs), teniendo cada GOP una cabecera con información de la estructura que sigue o pueden tener todos el mismo número y estructura de imágenes (closed GOPs). Una cadena típica con un tamaño de GOP de 15 puede ser:
I-B-B-P-B-B-P-B-B-P-B-B-P-B-B-I.
Todas las imágenes fijas que haya en un DVD (menús, subtítulos, fotografías, etc) serán imágenes I.
Para situaciones en las que se requiera mayor calidad se puede forzar el uso de imágenes I en puntos donde hay grandes cambios entre un frame y el siguiente, como en cambios de escena. Los cambios de capítulo o escena deben alinearse con imágenes I para que funcionen fluidamente, esto requiere a veces recodificar un trozo del MPEG2, en programas profesional esto se puede realizar sin recodificar todo el stream, esto se como recodificación basada en segmentos.
A la hora de codificar se puede hacer de dos maneras bit rate constante (CBR: Constant Bit Rate) ó variable (VBR: Variable Bit Rate). En CBR tenemos que el vídeo siempre ocupa la misma cantidad, esto nos permite saber perfectamente de antemano el tamaño total de la pista de vídeo, pero estaremos desperdiciando ancho de banda en escenas estáticas, mientras que escenas de gran movimiento podemos no llegar a tener la calidad suficiente. En VBR decimos la tasa media que queremos (para calcular el tamaño total) y la tasa máxima que puede llegar a alcanzar (recordemos que entre vídeo, audio y subimágenes no debemos pasar de 9.8 mbps), de tal manera que sólo usemos una gran cantidad de información en las zonas que realmente se necesita, el problema de este tipo de codificación es que primero debemos realizar una pasada para que el sistema analice en qué puntos debe aplicar qué cantidad de compresión y otra en la que realmente se codifica, el tiempo de codificación se aumenta y si el sistema codificador no es de gran calidad se pueden producir pérdidas de calidad.
En cuanto a sistemas de codificación, tenemos sistemas decodificadores basados únicamente en software (un ordenador con un procesador potente debería ser capaz de hacerlo en tiempo real), apoyados en hardware (tarjetas descompresoras MPEG2). Para la codificación MPEG2, el tiempo real sólo está al alcance de tarjetas dedicadas o ordenadores de muy alta gama.