Tutoriales y Manuales
Entradas Mensuales
-
►
2024
(Total:
1019
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
▼
2022
(Total:
967
)
-
▼
noviembre
(Total:
78
)
- Disponible qBittorrent 4.5
- Meta es multada en Europa con 265M€ por no cumplir...
- Proyecto OWASP: cabeceras de seguridad
- Estados Unidos prohíbe equipos de telecomunicacion...
- Puppet: la navaja suiza para la automatización de ...
- ¿Qué es la función Overdrive de un monitor?
- A la venta casi 500 millones de números de teléfon...
- MEGA Backup, nueva función de copia de seguridad p...
- En San Francisco (EE.UU.) los robots policía ya ti...
- Stable Diffusion 2.0, una AI capaz de sintetizar y...
- Reino Unido pide desconectar cámaras de seguridad ...
- La webcam cumple 31 años y nació para vigilar una ...
- Detectan páginas falsas de MSI Afterburner que min...
- Adobe te obliga a pagar una suscripción para rotar...
- Pagar para desbloquear toda la potencia de los Mer...
- Llevar tu PC o portátil a reparar puede poner en r...
- Los trabajadores del iPhone (FoxConn) en China se ...
- Europa tiene 2 de los 5 superodenadores más potent...
- Generali sufre un ciberataque a sus sistemas de in...
- La página web del Parlamento Europeo, víctima de u...
- Intel On Demand: el pago por desbloquear caracterí...
- Prohiben en las escuelas de Francia usar versiones...
- Wazuh: plataforma de seguridad de código abierto
- Twitter e Instagram preparan el cifrado de extremo...
- Polícia Italiana crea servicio IPTV falso para pod...
- Vanuatu: un país entero paralizado por un ataque d...
- Google pagó 360M$ a Activision Blizzard para evita...
- Donald Trump vuelve a Twitter tras la ajustada enc...
- La nueva Inteligencia Artificial de Google es capa...
- ¿Qué es el Subsistema de Windows para Linux? WSL
- La NSA recomienda dejar de usar C y C++ por altern...
- Meta descubre a más empleados vendiendo cuentas de...
- Arrestados dos rusos responsables de Z-Library, un...
- Los empleados de Twitter dimiten en masa tras el u...
- Tecnología de Intel FakeCatcher es capaz de detect...
- La VPN de Google One disponible para Windows y Mac
- La UE estudia mandar al espacio los centros de dat...
- Seagate presenta discos duros tan rápidos como los...
- Google implementará Privacy Sandbox en Android 13 ...
- Las peores contraseñas del 2022
- Activar el bloqueo dinámico en Windows 10-11 usand...
- PayPal te cobrará una comisión si no la utilizas e...
- Polícia de España desarticula red contenidos pirat...
- Google acuerda pagar una multa de 391 millones $ p...
- El CEO de FTX había implementado una puerta traser...
- C1b3rWall Academy: edición 2022‑2023 del curso gra...
- Dimiten de Twitter los directores de seguridad y p...
- Apple podría estar rastreando a sus usuarios aunqu...
- Detenido un importante operador ruso del ransomwar...
- Un hackeo roba a Hacienda de España datos de medio...
- El Gobierno de Catar hackeó a la FIFA para obtener...
- Crean un casco de realidad virtual que te mata de ...
- Diferencias entre Proxy's, VPN's y TOR
- Las nuevas cuentas verificadas de pago crean confu...
- Mozilla se plantea seguir dando soporte a Firefox ...
- Robados a Telefónica 2 millones de € en iPhones de...
- Herramienta oculta de Facebook te permite eliminar...
- EE.UU. incauta U$S1,4 mil millones en Bitcoin roba...
- ¿Qué es Mastodon? el Twitter descentralizado
- Orange España sufre una filtración de datos privad...
- Encuentran software Gimp con malware en la primera...
- Aumentan los intentos de robo de cuentas verificad...
- Elon Musk despide por error trabajadores de Twitte...
- PortMaster es una aplicación gráfica cortafuegos b...
- El fabricante alemán de neumáticos Continental es ...
- Cómo escanear códigos QR de forma segura
- China podrá acceder a los datos de usuarios europe...
- Un exempleado de Apple se enfrenta a 25 años de pr...
- AMD presenta nuevas tarjetas gráficas Radeon RX 79...
- Flipper Zero: dispositivo para pruebas radiofrecue...
- Google dice adiós a Hangouts y a la app de Street ...
- Elon Musk tiene previsto despedir a la mitad de lo...
- EnCodec es el nuevo códec de audio de Meta
- Los parches de OpenSSL ya están disponibles
- La Guardia Civil detiene a un menor de 17 años por...
- Hackearon el teléfono personal de Liz Truss
- Vulnerabilidades en la interfaz web de dispositivo...
- Elon Musk cobrará 8$ al mes en Twitter por la veri...
- ► septiembre (Total: 72 )
-
▼
noviembre
(Total:
78
)
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Después de ver qué es una vCPU y la diferencia entre núcleos (cores) e hilos en los procesadores, pasamos a explicar toda la nomenclatura d...
-
En el panorama en constante evolución de la seguridad de redes, OpnSense se ha convertido en una formidable solución de firewall. Nacido de...
-
Pese a que Gemini ofrece multitudes de opciones, recientemente, se ha dado a conocer una situación fuera de lo común. Hace unos días, un es...
EnCodec es el nuevo códec de audio de Meta
Meta (anteriormente Facebook) ha dado conocer su nuevo códec de audio llamado EnCodec, que utiliza técnicas de aprendizaje automático para aumentar la relación de compresión sin perder calidad.
- Meta ha creado con IA un nuevo un códec de audio diez veces más eficiente que MP3 en 64 kbps
- Los códecs tienen como función principal comprimir y descomprimir archivos multimedia sin alterar la calidad.
El nuevo enfoque puede comprimir y descomprimir audio en tiempo real para lograr reducciones de tamaño de última generación. El códec se puede utilizar tanto para la transmisión de audio en tiempo real como para la codificación para el almacenamiento posterior en archivos.
Hoy, estamos detallando el progreso que nuestra investigación fundamental de IA (FAIR) ha realizado en el área de la hipercompresión de audio impulsada por IA. Imagínese escuchar el mensaje de audio de un amigo en un área con poca conectividad y que no se detenga o falle. Nuestra investigación muestra cómo podemos usar la IA para ayudarnos a lograr esto.
EnCodec ofrecen dos modelos listos para descargar:
- Un modelo causal que utiliza una frecuencia de muestreo de 24 kHz, solo admite audio monofónico y se entrena en una variedad de datos de audio (adecuado para la codificación de voz). El modelo se puede utilizar para empaquetar datos de audio para su transmisión a velocidades de bits de 1,5, 3, 6, 12 y 24 kbps.
- Un modelo no causal que usa una frecuencia de muestreo de 48 kHz, admite sonido estéreo y se entrenó solo con música. El modelo admite tasas de bits de 3, 6, 12 y 24 kbps.
Para cada modelo, se ha preparado un modelo de lenguaje adicional, lo que permite lograr un aumento significativo en la relación de compresión (hasta un 40%) sin pérdida de calidad. A diferencia de proyectos anteriores para aplicar técnicas de aprendizaje automático a la compresión de audio, EnCodec se puede utilizar no solo para el empaquetado de voz, sino también para la compresión de música con una frecuencia de muestreo de 48 kHz, correspondiente al nivel de los CD de audio.
Según los desarrolladores del nuevo códec, al transmitir a una tasa de bits de 64 kbps en comparación con el formato MP3, lograron aumentar la relación de compresión de audio unas diez veces manteniendo el mismo nivel de calidad (por ejemplo, al usar MP3 requiere un ancho de banda de 64 kbps, para transferir con esa misma calidad en EnCodec, 6 kbps son suficientes).
Estos datos pueden luego ser decodificados utilizando una red neuronal. Logramos una tasa de compresión aproximada de 10x en comparación con MP3 a 64 kbps, sin pérdida de calidad. Si bien estas técnicas se han explorado antes para el habla, somos los primeros en hacerlo funcionar para audio estéreo muestreado de 48 kHz (es decir, calidad de CD), que es el estándar para la distribución de música.
La arquitectura del códec está construida sobre la base de una red neuronal con la arquitectura «transformador» y se basa en cuatro enlaces: codificador, cuantificador, decodificador y discriminador:
- El codificador extrae los parámetros de los datos de voz y los convierte en un flujo empaquetado a una velocidad de fotogramas más baja.
- El cuantificador (RVQ, Residual Vector Quantizer) convierte el flujo de salida del codificador en conjuntos de paquetes, comprimiendo la información en relación con la tasa de bits seleccionada. La salida del cuantificador es una representación comprimida de los datos adecuados para la transmisión a través de la red o para guardarlos en el disco.
- El decodificador decodifica la representación de datos comprimidos y reconstruye la onda de sonido original.
- El discriminador mejora la calidad de las muestras generadas (muestra) teniendo en cuenta el modelo de percepción auditiva humana.
Independientemente del nivel de calidad y tasa de bits, los modelos utilizados para codificar y decodificar difieren en requisitos de recursos bastante modestos (los cálculos necesarios para la operación en tiempo real se realizan en un núcleo de CPU).
Finalmente, para los que esten interesados, deben saber que la implementación de referencia de EnCodec está escrita en Python utilizando el marco PyTorch y tiene una licencia CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial) solo para uso no comercial.
Fuentes:
https://arxiv.org/abs/2210.13438
https://www.linuxadictos.com/encodec-el-nuevo-codec-de-audio-de-meta.html
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.