Los Formatos de Audio Digital

En el sitio www.digitalmundo.cl encontré este interesante artículo sobre los formatos de audio digital.

MP3 (Audio)
Es el formato de sonido digital comprimido más usado hasta la fecha. El nombre procede de MPEG-1 Layer 3, y no de MPEG-3, como puede dar a entender. La idea original surgió en el Instituto Fraunhofer, en Alemania, hace más de una década. Para obtenerlo se usan técnicas como la eliminación de frecuencias altas (casi imperceptibles para el oído humano), el efecto enmascaramiento (eliminación de sonidos de intensidad débil, cuando están superpuestos con otros de intensidad alta, que también son casi imperceptibles para nuestro oído) y la compresión tradicional, con el fin de reducir el tamaño de los archivos de sonido. Posteriormente ha evolucionado por diferentes caminos (el del propio IF, Xing, Blade, LAME…), pero teniendo siempre la misma base, aunque las diferencias en cuanto a calidad en estos momentos ya son notables. En principio se desarrolló para acompañar al compresor de vídeo MPEG-1 pero como ha demostrado el tiempo, resultó bastante mejor la parte de sonido que la de imagen. Su principal ventaja es que partiendo de una fuente de sonido digital sin comprimir, consigue reducir el tamaño de forma considerable, aunque a costa de perder parte de la información. Cuanto más se reduce el tamaño, más información (y por tanto, calidad) se pierde.

MP3 Pro (Audio)
Es un formato compatible con MP3 que añade nuevas técnicas de compresión aún más complejas.. La novedad se llama Spectral Band Replication (SBR), un sistema que permite «reconstruir» las altas frecuencias gracias a que durante la codificación se guarda información para hacerlo, empleando para ello muy poco espacio. El problema es que este sistema conseguirá una aproximación al original que puede ser poco fiel, ya que el decodificador completa las altas frecuencias “inventando” información de forma bastante subjetiva.

OGG Vorbis (Audio)
(Archivos con extensión .ogg): Destaca por su alta calidad y por ser un formato abierto. Se ha desarrollado a partir de cero, sin utilizar tecnologías previas sometidas a pago de derechos, de manera que cualquiera puede utilizarlo de forma gratuita, y sus especificaciones y código son de dominio público. Al ser un formato nuevo (relativamente), cuenta con la ventaja de que sus programadores ya conocían a la perfección lo bueno y lo malo de las técnicas de compresión anteriores. También cuenta con un gran respaldo por parte de usuarios expertos, lo que ha permitido afinar al máximo su configuración y los modelos de compresión psicoacústica.

MPC (MusePack) (Audio)
(Anteriormente conocido como MPEGplus, archivos con extensión .mp+ o .mpc): un formato muy interesante por la altísima calidad que consigue, a costa de emplear bitrates elevados. Aunque puede parecer un pequeño paso atrás (puede serlo en cuanto a compresión, pero no en cuanto a calidad), se basa en las técnicas de compresión MP2, mejoradas con soporte VBR y Joint-Estéreo, y en un ajuste muy bueno de sus librerías psicoacústicas, al igual que en el caso de Vorbis, gracias a la colaboración de usuarios expertos. Su autor (respaldado por test realizados por varias revistas especializadas y también por muchos fanáticos del audio digital) afirma que el formato MPC (extensión MPC y eventualmente MP+) es de mayor calidad que el MP3, para un mismo bitrate. El encoder no es muy versátil, aparentemente sólo codifica en VBR. En calidad baja (promedio 80kbps), calidad radio (promedio 150kbps), calidad standard (promedio 170kbps), calidad xtreme (promedio 195kbps) y calidad insane (promedio 230kbps).
WAV (o WAVE), apócope de WAVE form audio format (Audio)

Es un formato de audio digital normalmente sin compresión de datos desarrollado y propiedad de Microsoft y de IBM que se utiliza para almacenar sonidos en el PC. Es una variante del formato RIFF, método para almacenado en «paquetes», y relativamente parecido al IFF y al formato AIFF usado por Macintosh. El formato toma en cuenta algunas peculiaridades de la CPU Intel, y es el formato principal usado por Windows.

A pesar de que el formato WAV puede soportar casi cualquier códec de audio, se utiliza fundamentalmente con el formato PCM (no comprimido) y al no tener pérdida de calidad puede ser usado por profesionales.En Internet no es popular, fundamentalmente porque los archivos sin compresión son muy grandes. Son más frecuentes los formatos comprimidos con pérdida, como el MP3 o el Ogg Vorbis. Como éstos son más pequeños la transferencia a través de Internet es mucho más rápida. Además existen codecs de compresión sin pérdida más eficaces como Apple Lossless o FLAC.

ASF, posteriormente renombrado a Advanced Systems Format (Audio)
Es un contenedor multimedia de audio y video digital propiedad de Microsoft, diseñado especialmente para el streaming.
El formato no especifica como debe ser codificado el video o audio, en vez de eso solo especifica la estructura del flujo de video/audio. Lo que esto significa es que los archivos ASF pueden codificarse con prácticamente cualquier codec de audio/video sin que deje de ser formato ASF. Esta función es similar a la llevada a cabo por los formatos QuickTime, AVI u Ogg.
Los tipos de archivo más comunes contenidos en un archivo ASF son Windows Media Audio (WMA) y Windows Media Video (WMV).

Los archivos que contienen solo audio WMA pueden ser nombrados usando la extensión .wma, y los archivos que solo guardan video WMV suelen llevar la extensión .wmv. De todos modos, ambos pueden usar la extensión .asf si así se desea.

Este formato se confunde a menudo con la implementación de Microsoft del formato de video MPEG-4 (Windows Media Video), porque la mayoría de los flujos o archivos ASF se codifican usando este codec.

FLAC (Free Lossless Audio Codec) (Audio)
(Códec de compresión de audio sin pérdida en español) es un formato del proyecto Ogg para codificar audio sin pérdida, con la desventaja que los archivos ocupan bastante más espacio. Esto significa que el archivo inicial puede ser recompuesto totalmente.

Otros formatos como MPEG-1 Layer 3 (MP3), Windows Media Audio (WMA), Advanced Audio Coding (AAC), (Ogg Vorbis), Adaptive Transform Acoustic Coding ATRAC, ADPCM, etc., al comprimir el archivo pierden, de forma irreversible, parte de la información del original, a cambio de una gran pérdida de tamaño en el archivo. FLAC no pierde tanto tamaño de archivo, rara vez baja de dejar el archivo en un tercio del tamaño original, ya que no elimina nada de la información contenida en el original. Como norma se reduce entre la mitad hasta tres cuartos según el tipo de sonido procesado.

Algoritmo de compresión con pérdida
Se llama así a cualquier procedimiento de codificación que tenga como objetivo representar cierta cantidad de información utilizando una menor cantidad de la misma, siendo imposible una reconstrucción exacta de los datos originales.

La compresión con pérdida solo es útil cuando la reconstrucción exacta no es indispensable para que la información tenga sentido. La información reconstruida es solo una aproximación de la información original.

Suele restringirse a información analógica que ha sido digitalizada (imágenes, audio, video, etc…), donde la información puede ser parecida, y al mismo tiempo, ser subjetivamente la misma.
Su mayor ventaja reside en las altas razones de compresión que ofrece en contraposición a un algoritmo de compresión sin pérdida.

Existen dos técnicas comúnes de compresión con pérdida:
Por códecs de transformación: Los datos originales son transformados de tal forma que se simplifican (sin posibilidad de regreso a los datos originales). Creando un nuevo conjunto de datos proclives a altas razones de compresíon sin pérdida.

Por códecs predictivos: Los datos originales son analizados para predecir el comportamiento de los mismos. Después se compara esta predicción con la realidad, codificando el error y la información necesaria para la reconstrucción. Nuevamente, el error es proclive a altas razones de compresión sin pérdidaEn algunos casos se utilizan ambas, aplicando la transformación al resultado de la codificación predictiva.

Algoritmo de compresión sin pérdida
Se llama así a cualquier procedimiento de codificación que tenga como objetivo representar cierta cantidad de información utilizando una menor cantidad de la misma, siendo posible una reconstrucción exacta de los datos originales.

Este tipo de compresión se vuelve necesaria cuando se requiere conservar íntegramente la información original, en contraposición a lo que sucedería con un algoritmo de compresión con pérdida.

MPEG-4 ( Moving Picture Experts Group) (Video)
MPEG-4, introducido a finales de 1998, es el nombre de un grupo de estándares de codificación de audio y video así como su tecnología relacionada normalizada por el grupo MPEG (Moving Picture Experts Group) de ISO/IEC. Los usos principales del estándar MPEG-4 son los flujos de medios audiovisuales, la distribución en CD, la transmisión bidireccional por videófono y emisión de televisión.

MPEG-4 retoma muchas de las características de MPEG-1 y MPEG-2 así como de otros estándares relacionados, tales como soporte de VRML (Virtual Reality Modeling Language) extendido para Visualización 3D, archivos compuestos en orientación a objetos (incluyendo objetos audio, video y VRML), soporte para el manejo de derechos digitales externo y variados tipos de interactividad.

La mayoría de las características que conforman el estándar MPEG-4 no tienen que estar disponibles en todas las implementaciones, al punto que es posible que no existan implementaciones completadelestándar MPEG-4. Para manejar esta variedad, el estándar incluye el concepto de perfil (profile) y nivel, lo que permite definir conjuntos específicos de capacidades que pueden ser implementadospara cumplir con objetivos particulares.

DIVX (Video)
DivX es un códec de video, un formato de video comprimido.Comenzó a desarrollarse como un formato para la transmisión multimedia en internet, el MPEG4, pero pronto quedó relegado debido al gran tamaño de los ficheros, por otros formatos como el WMV de Microsoft, el QuickTime de Apple o el Real de RealNetworks, todos ellos de menor tamaño, ideales para vídeo bajo demanda.

Fueron dos jóvenes quienes, tomando como base el códec MPEG4 de Microsoft, crearon la versión 3.11 con el smile DivX 😉 como anagrama para su obra.
Actualmente el desarrollo es totalmente legal, llevado a cabo por DivxNetworks, que viendo el potencial real de este códec lo comercializó y trasladó al mercado de consumo. En la actualidad no es difícil encontrar reproductores domésticos capaces de leer este formato. Tras la comercialización del codec, algunos de los colaboradores siguieron su desarrollo libre, creando versiones como XviD o 3ivX, incluso desarrollos de nuevos contenedores multimedia como el Matroska.

Gracias a su desarrollo es posible almacenar más de una hora de video en un CD de 700MB con calidad cercana a la del DVD, sin tener que pagar royalties. Resulta ideal para los videoaficionados,que pueden guardar y distribuir su obra en este formato con menores problemas.

AVI (Video)
El formato AVI fue definido por Microsoft para su tecnología Video for Windows en 1992. Posteriormente fue mejorado mediante las extensiones de formato del grupo OpenDML de la compañía Matrox. Estas extensiones están soportadas por Microsoft, aunque no de manera oficial. Se conocen como AVI 2.0.

No obstante, este formato no es totalmente original. Está basado en el formato RIFF (Resource interchange File Format), que a su vez, se basa en el formato IFF (Interchange File Format) de la compañía Electronic Arts. Éste último data de 1985.
Actualmente, el formato AVI es un estándar de facto que ha traspasado su ámbito original de los sistemas operativos Windows a reproductores de DVD/DivX, otros sistemas operativos de ordenadores personales y videoconsolas.

JPEG (Joint Photographic Experts Group) (Imágen)
Es un algoritmo diseñado para comprimir imágenes con 24 bits de profundidad o en escala de grises. JPEG es también el formato de fichero que utiliza este algoritmo para comprimir imágenes. JPEG sólo trata imágenes fijas, pero existe un estándar relacionado llamado MPEG para videos. El formato de archivos JPEG se abrevia frecuentemente JPG debido a que algunos sistemas operativos sólo aceptan tres letras de extensión.

JPEG es un algoritmo de compresión con pérdida. Esto significa que al descomprimir la imagen no obtenemos exactamente la misma imagen que teníamos antes de la compresión.
Una de las características que hacen muy flexible el JPEG es el poder ajustar el grado de compresión. Si especificamos una compresión muy alta se perderá una cantidad significativa de calidad, pero obtendremos ficheros pequeños. Con una cantidad de compresión baja obtenemos una calidad muy parecida a la del original, y un fichero extremadamente grande .
Esta pérdida de calidad se acumula. Esto significa que si comprime una imagen y la descomprime obtendrá una calidad de imagen, pero si vuelve a comprimirla y descomprimirla otra vez obtendrá una perdida mayor. Cada vez que comprima y descomprima la imagen esta perderá algo de calidad.

El formato de ficheros JPEG o JPG fue creado por un grupo independiente, llamado JFIF (JPEG File Interchange Format), quienes se encargan solo de la utilización del algoritmo JPEG para almacenar imágenes. Existen otros formatos de fichero que también utilizan el algoritmo JPEG, el más conocido de ellos es JNG.

JPEG/JFIF es el formato más utilizado para almacenar y transmitir archivos de fotos en la Web. Pero la compresión con pérdida del formato no conviene a diagramas que incluyen textos y líneas.

Deja una respuesta Cancelar la respuesta