Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon
Mostrando entradas con la etiqueta prosodia. Mostrar todas las entradas
Mostrando entradas con la etiqueta prosodia. Mostrar todas las entradas

PostHeaderIcon VoxCPM: cuando el TTS deja de sonar a TTS


VoxCPM de OpenBMB revoluciona el TTS eliminando la tokenización discreta con una arquitectura diffusion autoregresiva en espacio continuo, logrando naturalidad sin precedentes en prosodia y voice cloning con solo ~5 segundos de audio. Entrenado con 1.8M horas bilingües, ofrece calidad profesional (44.1kHz, 800M parámetros) y API accesible, marcando un cambio de paradigma en síntesis de voz.