Guía de formato de audio: MP3, M4A, AAC, FLAC y más

Published:

Lily Katz / Autoridad de Android

Cuando el reproductor de MP3 despegó a fines de la década de 1990, el formato en sí llegó a la conciencia pública de una manera que no muchos otros han hecho, tal vez con el documento de Word como una excepción. Pero, ¿qué es exactamente un formato de audio y por qué debería importarte?

Esta guía cubre algunos de los formatos más populares utilizados por los servicios de transmisión de audio en la actualidad y explica sus diferencias.

¿Qué es un formato de archivo de audio?

Un gráfico con una señal de onda y la correspondiente representación PCM de esa onda debajo de ella.

Un archivo de audio digital es la forma en que el contenido grabado se almacena en una computadora, reproductor multimedia, teléfono inteligente u otro dispositivo. El audio digital, en su nivel más básico, es una serie de números que un dispositivo puede usar para imitar las ondas de sonido. Hay varias formas de lograr esto y luego comprimir (o no) los datos resultantes. Sabemos que muestreando una onda de sonido en el proceso de conversión de analógico a digital con un mínimo de 16 bits a 44,1 kHz, podemos reproducir perfectamente la señal capturada posteriormente. Esto se debe a algunas matemáticas llamadas teorema de muestreo de Nyquist-Shannon. Podemos lograr tasas de bits y rangos de frecuencia más altos, pero si alguien puede escuchar la diferencia, incluso si son los mejores auriculares, es discutible en el mejor de los casos.

Si solo almacenamos esos datos tal como están (lo que se conoce como modulación de código de pulso o PCM), el archivo ocupa mucho espacio. Por lo tanto, se han desarrollado formas de compresión de audio con pérdida y sin pérdida. El audio con pérdida arroja frecuencias de audio que nuestros oídos no pueden escuchar, mientras que el sin pérdida las retiene todas. Los formatos de audio con pérdida también pueden usar otros trucos para comprimir el audio aún más, de lo que hablaremos más adelante.

Dado que la mayoría de las personas acceden a su música a través de servicios de transmisión en estos días, los formatos de archivo comprimidos con pérdida son la forma principal en que se distribuye el contenido. Eso está bien si escuchas casualmente, pero algunas personas exigen la máxima calidad. Como resultado, ahora hay disponibles más y más opciones de transmisión de alta calidad e incluso sin pérdidas. Pero no se puede evitar el hecho de que los formatos con pérdida ocupan menos espacio y consumen menos datos móviles, como lo deja claro el cuadro a continuación.

Tamaños de archivos estéreo (16 bits 44,1 kHz) WAV AIFF FLAC (típico) MP3 (320 Kbps) MP3 (192 Kbps)
Tamaños de archivos estéreo (16 bits 44,1 kHz)

1 minuto

WAV

10,6 MB

AIFF

10,6 MB

FLAC (típico)

6,4 MB

MP3 (320 Kbps)

2,4 MB

MP3 (192 Kbps)

1,4 MB

Tamaños de archivos estéreo (16 bits 44,1 kHz)

4 minutos

WAV

41,6 MB

AIFF

41,6 MB

FLAC (típico)

24,9 MB

MP3 (320 Kbps)

9,6 MB

MP3 (192 Kbps)

5,6 MB

Tamaños de archivos estéreo (16 bits 44,1 kHz)

1 hora

WAV

635 MB

AIFF

635 MB

FLAC (típico)

381 megabytes

MP3 (320 Kbps)

144 MB

MP3 (192 Kbps)

84MB

MP3

mejor imagen de portada de reproductor de mp3

El formato de archivo de audio MP3 una vez reinó supremamente cuando se trataba de descargar música. De hecho, el formato se ha vuelto tan sinónimo de soluciones de música móvil que «reproductor de MP3» ahora es genérico para un dispositivo de reproducción de audio. Hoy, sin embargo, es menos prominente por varias razones. Sin embargo, persiste. Si entendemos los archivos MP3, también podemos entender otros formatos más fácilmente, así que empezaremos aquí.

Un archivo MP3 es un archivo de audio con pérdida, lo que significa que arroja datos que nuestros oídos no pueden escuchar. Casi todos los humanos tienen un rango de audición en algún lugar en el rango de 20Hz a 20kHz. El límite superior en realidad disminuye con la edad, pero en general ese es el rango dentro de cualquier sonido que escucharás mentiras. Sabiendo que otras frecuencias son redundantes, MP3 ignora todas las frecuencias fuera de este rango.

Para ahorrar más espacio, los archivos MP3 usan aún más trucos. Los ingenieros de audio utilizan algoritmos de modelado de ruido basados ​​en los efectos psicoacústicos del oído y el cerebro humanos para eliminar partes de la música que no deberíamos poder escuchar. Por ejemplo, el cerebro no puede distinguir entre dos frecuencias que están una al lado de la otra. Además, el oído humano adulto tiene dificultad para identificar la dirección de los sonidos de alta frecuencia. También empieza a perder sensibilidad por encima de los 16 kHz. Además, los ruidos fuertes pueden enmascarar los ruidos bajos. Todos estos se pueden eliminar con poca o ninguna diferencia notable para el oyente final.

Básicamente, los archivos MP3 eliminan frecuencias que no podemos escuchar y frecuencias que podemos escuchar individualmente, pero no por la forma en que se combinan en una canción en particular.

Un MP3 divide una pista en 576 fotogramas de muestra y se utilizan transformadas rápidas de Fourier (FFT) para obtener datos de frecuencia de estos fotogramas. Luego, los datos de frecuencia se analizan para ver si hay oportunidades de aplicar las reglas de compresión basadas en la audición humana, como se describe anteriormente. Si es así, estas partes se redondean hacia abajo (cuantificadas) para reducir las tasas de bits, lo que ahorra espacio. Los datos sobre la restauración de cada cuadro a la representación completa de la onda de sonido se almacenan en un encabezado de 32 bits.

La tasa de bits determina el tamaño de archivo máximo permitido para cada fotograma. Cuanto más agresiva sea la compresión, más probable es que el algoritmo elimine algo que sea audible. Además, este tipo de filtrado y corte no es perfecto y la cuantificación puede dejar artefactos que algunas personas pueden escuchar. A esta compresión psicoacústica con pérdidas le sigue una compresión de codificación Huffman sin pérdidas que es similar a un archivo .zip para ahorrar más espacio.

Si eso suena demasiado complicado, la conclusión es que los archivos MP3 eliminan frecuencias que no podemos escuchar y que teóricamente podríamos escuchar por separado, pero no en una canción dada debido al enmascaramiento auditivo. Esto puede conducir a tamaños de archivo bastante pequeños. Sin embargo, si se hace de forma demasiado agresiva o con una tasa de bits demasiado baja, la calidad puede verse afectada. Como resultado, MP3 ya no es tan popular para la transmisión.

Formatos de audio AAC, M4A y OGG Vorbis

Una captura de pantalla de la aplicación Apple Music de macOS.

Zak Khan / Autoridad de Android

La compresión de audio puede tomar muchas formas y se han desarrollado otros formatos. Estos utilizan algoritmos y técnicas ligeramente diferentes para hacer el trabajo, por lo que no podemos compararlos solo en función de la tasa de bits.

OGG Vorbis es una alternativa de código abierto a MP3. Todavía usa FFT y métodos similares para analizar y cuantificar la información de frecuencia enmascarable, pero usa un algoritmo diferente. Vorbis también tiene en cuenta el ruido de fondo para mejorar el rendimiento a velocidades de bits bajas. Spotify utiliza este formato a 320 kbps.

También está AAC, que es utilizado por Apple Music, Tidal, Pandora y YouTube Music. Es una evolución del formato MPEG (MP3) y permite frecuencias de muestreo más altas, hasta 96 kHz. Además, la longitud del cuadro puede cambiar dinámicamente entre 1024/960 o 128/120 muestras para una mejor resolución si es necesario. Se desempeña mejor en tamaños de archivo más pequeños que los MP3, para arrancar.

Otro tipo de archivo que puede encontrar es el archivo M4A. Estos archivos se codifican en formato AAC y luego se almacenan en un contenedor MPEG-4, de ahí la extensión de archivo .m4a. Apple creó este tipo en respuesta a MP3. Si bien no es tan universalmente compatible, no es raro de ninguna manera.

Por estas razones, no puede comparar directamente las tasas de bits y afirmar que una tasa de bits más alta sería un archivo con mejor sonido entre, por ejemplo, AAC y MP3. Los archivos AAC y M4A con una tasa de bits más baja aún pueden sonar bien y ocupan menos espacio.

Eso hace que formatos como OGG Vorbis y AAC sean atractivos para los servicios de transmisión. Pueden ofrecer un sonido de mayor calidad utilizando menos datos móviles.

FLAC

Aplicación Android de Deezer

Si no desea deshacerse de las frecuencias, pero aún desea un archivo que sea más pequeño que los datos sin procesar, FLAC entra en juego. FLAC no elimina ninguna parte de una grabación y por eso se llama sin pérdidas. La versión de Apple de un códec sin pérdidas se llama ALAC. Ambos códecs funcionan como un archivo .zip. Si alguna vez comprimió una colección de archivos y luego los extrajo, comprenderá la idea básica. No se elimina nada, el archivo FLAC solo busca formas de consolidar patrones y datos repetitivos y luego los reconstruye en la reproducción.

Sin embargo, los archivos FLAC nunca serán tan pequeños como los archivos MP3 o AAC. Pero a medida que el ancho de banda se vuelve más barato y accesible, más y más servicios de transmisión ofrecen la opción de transmitir con FLAC. Suelen ser suscripciones «HD», «Ultra HD» o «HiFi». Amazon Music Unlimited, Tidal HiFi y HiFi Plus, Deezer Premium y Qobuz ofrecen transmisión FLAC.

Tenga en cuenta que los archivos FLAC son más grandes que los formatos con pérdida y pueden consumir una gran cantidad de sus datos. Si los almacena en un dispositivo, también ocupan espacio de almacenamiento con bastante rapidez.

Formatos de audio WAV y AIFF

Recortar audio en Audacity 2

Las grabaciones de audio se pueden almacenar PCM puro en un dispositivo, que es esencialmente lo que son WAV (en Windows) y AIFF (en Mac). Representan algunas de las primeras formas de almacenamiento de música digital. No se ha aplicado compresión ni nada más a estos archivos. De hecho, puede averiguar el tamaño de su archivo con bastante facilidad con la siguiente ecuación:

Tamaño de PCM = frecuencia de muestreo X (bits por muestra/8) X tiempo en segundos X número de canales

Como resultado, estos formatos pueden generar tamaños de archivo increíblemente grandes. Eso significa que son bastante raros para la transmisión y descarga, aunque los servicios como HDtracks los ofrecen. Para lo que estos archivos son realmente útiles es para mezclar y editar audio. Dado que no se ha realizado ninguna conversión, compresión ni nada más, es fácil y rápido editar, guardar y volver a editar pistas si es necesario.

Esto te podría gustar..

Recién publicado