El video no es una continua secuencia de imágenes, sino "fotografía en movimiento" La retina tiene la propiedad de retener durante unos instantes lo último que ha visto de modo cuando vemos una secuencia de imágenes pero que cambia rápidamente, las imágenes se superponen en nuestra retina unas sobre otras dando la sensación de continuidad y movimiento.
Hoy vamos a hablar de una serie de conceptos básicos sobre ,televisión y la edición de video:
Pixel: es la menor unidad homogénea en color que forma parte de una imagen digital, ya sea esta una fotografía, un fotograma de vídeo o un gráfico.
Ampliando lo suficiente una imagen digital - zoom -, por ejemplo en la pantalla de un ordenador, pueden observarse los píxeles que componen la imagen. Los píxeles aparecen como pequeños cuadrados o rectángulos en color, en blanco o en negro, o en matices de gris. Las imágenes se forman como una matriz rectangular de píxeles, donde cada píxel forma un área relativamente pequeña respecto a la imagen total.
En las imágenes de mapa de bits o en los dispositivos gráficos cada píxel se codifica mediante un conjunto de bits de longitud determinada - la llamada profundidad de color -; por ejemplo, puede codificarse un píxel con un byte - 8 bits -, de manera que cada píxel admite 256 variaciones -28 variaciones con repetición de 2 valores posibles en un bit tomados de 8 en 8-. En las imágenes de color verdadero, se suelen usar tres bytes para definir un color; es decir, en total podemos representar un total de 224 colores, que suman 16.777.216 opciones de color -32 bits son los mismos colores que 24 bits, pero tiene 8 bits más para transparencia-.
Para poder transformar la información numérica que almacena un píxel en un color, hemos de conocer, además de la profundidad y brillo del color -el tamaño en bits del píxel-, el modelo de color que estamos usando. Por ejemplo, el modelo de color RGB - Red-Green-Blue - permite crear un color componiendo tres colores básicos: el rojo, el verde y el azul. De esta forma, en función de la cantidad de cada uno de ellos que usemos veremos un resultado u otro.
Dimensiones: están representadas por el ancho y el alto de los videos. Los valores de dos dimensiones se expresa en pixeles. Existen varios stándares al respecto:
- Flash 320x240
- Video-CD 352x288
- Video PAL (DVD) 720x576
Existen otros formatos para video como el 640x480 pero no se usan para reproducir videos en el televisor sino para reproducirlos en el ordenador.
Además en la televisión analógica existen varios sistemas mutuamente incompatibles de televisión, el NTSC se usa típicamente USA a razón de 525 líneas/60 Hz mientras que el PAL es habitual en Europa a razón de TV de 625 líneas/50 Hz. El Secam es propio de Francia y de algunos países de Africa. La tasa de refresco - Hz -: Una tasa de refresco de 50 Hz significa que la imagen será reconstruída 50 veces por segundo. Una mayor tasa de refresco en un monitor o pantalla implica que la imagen se verá mas consistente:
La codificación del formato del vídeo en el DVD varía en PAL o NTSC:
- PAL/SECAM: 720x576 píxeles, 25 fotogramas por segundo.
- NTSC: 720x480 píxeles, 29.97 cuadros por segundo.
En cuanto a la reproducción de los videos, la mayoría de los reproductores DVD y televisores PAL pueden reproducir videos digitales en NTSC. Lo que no suele ser suceder a la inversa. Además, puesto que las películas de cine tienen 24 fps. Al convertirse a PAL son aceleradas un 4% (25 / 24 = 1.04), lo que hace que el audio deba ser ajustado de acuerdo a esto antes de ser codificado. Por esto, al reproducir un DVD en PAL oímos el audio ligeramente más agudo -concretamente, medio semitono-. Al menos, en esto ganamos a los americanos, ya que vemos las mismas películas en menos tiempo que ellos.
Televisión digital: la televisión digital -o DTV, de sus siglas en inglés: Digital TV- se refiere al conjunto de tecnologías de transmisión y recepción de imagen y sonido, a través de señales digitales. En contraste con la televisión tradicional, que codifica los datos de manera analógica, la televisión digital codifica sus señales de forma binaria, habilitando así la posibilidad de crear vías de retorno entre consumidor y productor de contenidos, abriendo la posibilidad de crear aplicaciones interactivas, y la capacidad de transmitir varias señales en un mismo canal asignado, gracias a la diversidad de formatos existentes.
La televisión digital acepta varios formatos de transmisión, a diferentes resoluciones, lo que permite a los productores de televisión crear sub canales de transmisión. A saber:
- 480i - La imagen mide 720x480 pixeles, desplegada a 60 cuadros entrelazados por segundo (30 cuadros completos por segundo).
- 480p - La imagen mide 720x480 pixeles, desplegada a 60 cuadros completos por segundo.
- 576i - La imagen mide 720x576 pixeles, desplegada a 50 cuadros entrelazados por segundo (25 cuadros completos por segundo).
- 576p - La imagen mide 720x576 pixeles, desplegada a 50 cuadros completos por segundo.
- 720p - La imagen mide 1280x720 pixeles, desplegada a 60 cuadros completos por segundo.
- 1080i - La imagen mide 1920x1080 pixeles, desplegada a 60 cuadros entrelazados por segundo (30 cuadros completos por segundo).
- 1080p - La imagen mide 1920x1080 pixeles, desplegada a 60 cuadros completos por segundo.
Visualización de video/esćaneo
Escaneo entrelazado: se usa en los formatos estándar de televisión NTSC, PAL y SECAM y visualiza sólo la mitad de las líneas horizontales en cada pasada (cada fotograma se divide en dos campos, el primero contiene todas las líneas de numero impar y el segundo las de numero par). Debido al fenómeno de "persistencia de nuestra visión", en nuestro cerebro "unimos" las dos pasadas del fotograma entrelazado, quedándonos con una sola imagen. Esto se ha utilizado tradicionalmente para obtener altas velocidades de refresco -50 Hz en PAL, 60 Hz en NTSC- con únicamente la mitad del flujo de datos. A cambio, la resolución horizontal queda afectada, ya que cada fotograma se compone de dos "medias imágenes", que al mezclarse pueden dar lugar a parpadeo, doble imagen. Para ello se utilizan cristales de cuarzo.
Escaneo progresivo: se usa en monitores de computadoras, proyectores y televisión digital y visualiza todas las líneas horizontales de una sola vez como si fuesen un único fotograma.
Bitrate: el bitrate es la cantidad de información que necesita un vídeo en cada segundo. Se suele medir en kilobits por segundo (kbps). A mayor bitrate, mayor calidad. El bitrate puede ser fijo o variable. El variable consigue una mayor calidad de imagen aumentando cuando aparecen escenas complejas y disminuye cuando las escenas están formados por imágenes.
Frame y keyframe: un keyframe es un frame sin comprimir. Un archivo de vídeo no es mas que una sucesión de imágenes -frames- que son mostradas una tras de otra, pero el codec intenta comprimir toda esa información. Los keyframes son útiles para desplazarnos por el vídeo sin tener que volver a recorrer todos los frames desde el principio. Un keyframe cada 5 o 10 segundos es un buen valor para videos largos, y cada segundo para vídeos cortos.
Tasa de frames: representa el número de imágenes -frames- por segundo que tiene el vídeo su unidad es fps -frame per second- . Un valor entre 15 y 30 suele ser el habitual pero por mi experienca aconsejo que sea superior a 20 fps pues pocas imágenes por segundo ofrecerán como resultado un video de una calidad relativamente pobre.
- Animación: 15 fps
- Película: 24 fps
- Vídeos en DVD en Europa: 25 fps.
- Vídeos en DVD en USA: 23.97 fps.
Aspect ratio: es la proporcion de aspecto entre el ancho y el alto del vídeo. El aspect ratio usual para vídeos domésticos es el llamado 4:3 -352 x 288 o el 720 x 576 por ejemplo- Así se vé la imagen ocupando toda la pantalla del televisor sin franjas normalmente de color negro. En DVD también tenemos el 16:9 con resoluciones de 2.35:1 o 1.81:1 o incluso 1.75:1. Al visualizar esos vídeos en una pantalla de televisor, aparecen franjas negras arriba y abajo para mantener la relación de aspecto y no ver las imágenes deformadas. También tengo que decir que aunque muchos de los televisores tienen un aspect radio de 4:3 empezaron a fabricarse hace años televisores en formato panorámico con aspect radio 16:9.
Cropping: consiste en recortar la imagen del vídeo a lo largo de toda su duración . Por ejemplo si nuestro vídeo es 512 x 296 y queremos que quede en 512 x 224.
Resizing: consiste en achatar la imagen de un video sin que por ello suponga una merma en la calidad.
Video compression: consiste en la reducción de calidad usada para representar imagenes que forman parte de un video digital, jugando con una combinación de una compresión de dicha imagen combinada con una compensación temporal de la película a medida que se va codificando la información del video.
Audio compression: es un tipo de compresión en el que la cantidad de datos en una grabación grabada que se reduce para su transmisión
Sample rate: es un concepto de audio que representa la frecuencia de muestreo, y tiene que ver con la calidad del sonido. El oído humano no percibe frecuencias superiores a 20.000 ciclos - Hz - por lo que una frecuencia excesiva solo agrandará el tamaño de tus archivos además de hacerla inaudible.
Es muy dificil englobar todo lo relacionado sobre televisión, video y edición de video en una entrada de blog. Lo que acabais de leer lo he extraído de diferentes webs y yo poco he aportado personalmente.
Saludos.
Fuentes: