Códecs, contenedores y protocolos de comunicación
📊 Tablas resumen (para memorizar rápido)
Códecs de vídeo
| Códec |
Año |
Creador |
Idea clave |
| H.264 / AVC |
2003 |
ITU-T + MPEG |
Estándar universal, máxima compatibilidad |
| H.265 / HEVC |
2013 |
ITU-T + MPEG |
~50% menos bitrate que H.264, soporta 4K/HDR, líos de patentes |
| AV1 |
2018 |
Alliance for Open Media (Google, Netflix, Mozilla…) |
Abierto y sin royalties, ~30% mejor que HEVC |
Códecs de audio
| Códec |
Año |
Creador |
Idea clave |
| AAC |
1997 |
MPEG (Fraunhofer, Dolby, Sony…) |
Sucesor del MP3, con pérdida, estándar en vídeo |
| Opus |
2012 |
IETF (RFC 6716) |
Con pérdida, muy versátil (voz + música), baja latencia, abierto |
| FLAC |
2001 |
Josh Coalson / Xiph.Org |
Sin pérdida, abierto, audio bit-perfect |
Contenedores
| Contenedor |
Año |
Creador |
Códecs típicos |
| MP4 |
2001 |
ISO/IEC MPEG (basado en MOV) |
H.264/H.265/AV1 + AAC |
| MOV |
1991 |
Apple (QuickTime) |
H.264, ProRes, AAC |
| MKV |
2002 |
Proyecto Matroska |
Casi cualquiera (abierto y flexible) |
| WebM |
2010 |
Google |
VP8/VP9/AV1 + Vorbis/Opus (solo abiertos) |
| AVI |
1992 |
Microsoft |
DivX, Xvid, MP3… (legado) |
Protocolos VoIP / tiempo real
| Protocolo |
Año |
Creador |
Función |
| SIP |
1999 / 2002 |
IETF (RFC 3261) |
Señalización: monta y cierra la llamada |
| RTP |
1996 / 2003 |
IETF (RFC 3550) |
Transporte del audio/vídeo en tiempo real |
| WebRTC |
2011–2021 |
Google → W3C + IETF |
Comunicación tiempo real entre navegadores |
| VoLTE |
2014 |
3GPP |
Voz sobre red de datos 4G/LTE (usa SIP + RTP) |
📺 Códecs de vídeo
Un códec (codificador/descodificador) es el algoritmo que comprime y descomprime el flujo de vídeo o audio. No es lo mismo que el contenedor (que es el "envoltorio" del archivo).
H.264 / AVC (Advanced Video Coding)
- Creado por: ITU-T (VCEG) + ISO/IEC (MPEG), publicado en 2003.
- Estandarizado como: MPEG-4 Parte 10 / ITU-T H.264.
- Qué hace: compresión con pérdida muy eficiente para su época; usa predicción inter/intra, transformadas enteras y CABAC/CAVLC para la codificación entrópica.
- Uso típico: Blu-ray, streaming (YouTube, Netflix histórico), videollamadas, cámaras IP. Hoy sigue siendo el códec más compatible del mundo.
- Licencia: de pago (MPEG-LA, ahora Via LA).
H.265 / HEVC (High Efficiency Video Coding)
- Creado por: ITU-T + ISO/IEC (MPEG), publicado en 2013.
- Qué hace: sucesor de H.264. Reduce el bitrate ~50% para la misma calidad. Soporta 4K, 8K, HDR.
- Uso típico: 4K UHD Blu-ray, streaming 4K, grabación en iPhone/cámaras modernas.
- Licencia: lío de patentes (varios pools: MPEG-LA, HEVC Advance, Velos Media…), lo que ha frenado su adopción en la web.
- Creado por: Alliance for Open Media (AOMedia) — consorcio fundado en 2015 por Google, Mozilla, Cisco, Microsoft, Netflix, Amazon, Intel, etc. Publicado en 2018.
- Qué hace: códec abierto y libre de royalties, ~30% más eficiente que HEVC. Pensado para streaming en internet.
- Uso típico: YouTube, Netflix, Twitch, Meta. Soportado en Chrome, Firefox, navegadores modernos y, desde hace pocas generaciones, en hardware (Intel Arc, NVIDIA RTX 40+, Apple Silicon M3+).
- Licencia: gratuita y abierta.
Otros que conviene conocer
- VP9 (Google, 2013): predecesor de AV1, abierto, usado en YouTube.
- MPEG-2 (1995): DVD y TDT antigua.
- H.266 / VVC (2020): sucesor de HEVC, ~50% más eficiente; adopción aún incipiente.
🎵 Códecs de audio
AAC (Advanced Audio Coding)
- Creado por: ISO/IEC MPEG (con participación de Fraunhofer IIS, Dolby, Sony, AT&T, Nokia). Publicado en 1997 (MPEG-2) y extendido en 1999 (MPEG-4).
- Qué hace: compresión con pérdida, sucesor de MP3. Mejor calidad a igual bitrate.
- Uso típico: iTunes/Apple Music, YouTube, vídeo digital (suele acompañar a H.264/H.265), radio digital.
- Licencia: de pago (Via LA).
Opus
- Creado por: IETF (estandarizado en RFC 6716, año 2012). Combina CELT (Xiph.Org) + SILK (Skype/Microsoft).
- Qué hace: códec con pérdida muy versátil: cubre desde voz a 6 kbps hasta música a 510 kbps con latencia muy baja (5–60 ms). Sustituye tanto a Vorbis como a Speex.
- Uso típico: WebRTC (obligatorio), Discord, WhatsApp, Zoom, YouTube, Telegram, PS4/PS5.
- Licencia: abierto y libre de royalties.
FLAC (Free Lossless Audio Codec)
- Creado por: Josh Coalson en 2001, ahora mantenido por la Xiph.Org Foundation.
- Qué hace: compresión sin pérdida (~50–60% del tamaño del PCM original). Bit-perfect.
- Uso típico: archivo de música de alta fidelidad, ripeos de CD, audio profesional/preservación.
- Licencia: abierto y libre.
Otros que conviene conocer
- MP3 (Fraunhofer, 1993): el clásico con pérdida; patentes ya expiradas.
- Vorbis (Xiph.Org, 2000): abierto, predecesor de Opus en muchos contextos.
- ALAC (Apple, 2004): equivalente a FLAC en el mundo Apple.
📦 Contenedores
Un contenedor no comprime nada: agrupa pistas de vídeo, audio, subtítulos, capítulos y metadatos en un solo archivo. El mismo contenedor puede llevar distintos códecs.
MP4 / .mp4 (MPEG-4 Part 14)
- Creado por: ISO/IEC MPEG, publicado en 2001.
- Basado en: el formato QuickTime (MOV) de Apple.
- Códecs típicos: H.264, H.265, AV1 / AAC, Opus (más raro).
- Uso: el contenedor universal hoy en día.
- Creado por: Apple, en 1991, junto con QuickTime.
- Códecs típicos: H.264, H.265, ProRes (códec profesional de Apple), AAC, PCM.
- Uso: edición de vídeo profesional (Final Cut, Premiere), cámaras Apple.
MKV / .mkv (Matroska)
- Creado por: proyecto Matroska (Lasse Kärkkäinen y Steve Lhomme), iniciado en 2002.
- Códecs: prácticamente cualquiera (H.264, H.265, AV1, VP9, FLAC, Opus, AAC…), múltiples pistas de audio y subtítulos.
- Uso: rips de Blu-ray, anime, comunidad de vídeo en general.
- Licencia: abierto.
WebM
- Creado por: Google, en 2010, basado en Matroska pero simplificado.
- Códecs permitidos: vídeo VP8 / VP9 / AV1, audio Vorbis / Opus. Solo códecs abiertos.
- Uso: HTML5
<video>, YouTube, WebRTC.
AVI / .avi (Audio Video Interleave)
- Creado por: Microsoft, en 1992.
- Códecs: muchos (DivX, Xvid, MJPEG, MP3…).
- Uso: histórico/legado; ya muy poco usado.
Otros
- FLV (Adobe, 2003): contenedor de Flash, hoy obsoleto.
- 3GP (3GPP, 2004): variante reducida de MP4 para móviles.
- TS / M2TS: contenedor de transporte (MPEG-TS) usado en TDT, Blu-ray y streaming HLS.
- Ogg (Xiph.Org, 2002): contenedor abierto, asociado a Vorbis, Opus, Theora.
☎️ Protocolos de comunicaciones de voz / VoIP
SIP (Session Initiation Protocol)
- Creado por: IETF, estandarizado en RFC 2543 (1999) y revisado en RFC 3261 (2002). Autores principales: Henning Schulzrinne y Mark Handley.
- Qué hace: protocolo de señalización a nivel de aplicación. Se encarga de establecer, modificar y terminar sesiones multimedia (llamadas, videollamadas, conferencias). No transporta voz, solo la negocia (con SDP describe los códecs, IPs, puertos…).
- Uso: centralitas IP (Asterisk, FreePBX, 3CX), operadores VoIP, troncales SIP empresariales, VoLTE/VoWiFi.
RTP (Real-time Transport Protocol)
- Creado por: IETF, estandarizado en RFC 1889 (1996), actualizado en RFC 3550 (2003).
- Qué hace: transporta los datos multimedia en tiempo real (audio/vídeo). Va sobre UDP. Incluye marcas de tiempo, números de secuencia y tipo de payload para reordenar paquetes y sincronizar.
- Acompañado de: RTCP (control, estadísticas de calidad) y SRTP (versión segura, con cifrado).
- Relación con SIP: SIP "monta la llamada", RTP "lleva la voz".
WebRTC (Web Real-Time Communication)
- Creado por: Google (liberó el código en 2011), estandarizado por W3C (APIs) e IETF (protocolos). Versión 1.0 publicada en 2021.
- Qué hace: permite comunicación en tiempo real (audio, vídeo, datos) directamente entre navegadores sin plugins. Internamente usa SDP para negociar, ICE/STUN/TURN para atravesar NAT, DTLS para cifrar y SRTP para el transporte. Códecs obligatorios: Opus (audio) y VP8 + H.264 (vídeo).
- Uso: Google Meet, Jitsi, Discord (en parte), videollamadas en WhatsApp Web, soporte en directo de webs, juegos en la nube.
VoLTE (Voice over LTE)
- Creado por: 3GPP (organismo que estandariza las redes móviles), especificado a partir de 2014 sobre LTE.
- Qué hace: lleva las llamadas de voz a través de la red de datos LTE/4G en vez de caer a 3G/2G como antes. Usa IMS (IP Multimedia Subsystem) como núcleo, con SIP para señalización y RTP para el audio (códec AMR-WB / EVS).
- Ventajas: llamadas HD, conexión más rápida, internet sigue funcionando durante la llamada.
- Variantes hermanas: VoWiFi (lo mismo pero sobre Wi-Fi) y VoNR / Vo5G (lo mismo sobre 5G).
🧩 Cómo encajan todos
┌─────────────────────────────┐
│ Archivo: pelicula.mp4 │ ← Contenedor (MP4)
│ ├── Pista vídeo: H.265 │ ← Códec de vídeo
│ ├── Pista audio: AAC │ ← Códec de audio
│ └── Pista subtítulos │
└─────────────────────────────┘
Llamada VoIP:
SIP ─────► establece la llamada (señalización)
RTP ─────► transporta el audio (códec Opus / AMR / EVS)
RTCP ────► calidad y control