Productos FTTH

Tienda FFTH desde 2004

Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon El popular traductor de texto DeepL Translate ahora traduce voz a voz en tiempo real


Transcribir audio a texto es cosa del pasado, ahora la tendencia son las traducciones voz a voz. DeepL ha dado el paso.







Hoy en día traducir voz a texto gracias a Whisper de OpenAI y similares, nos parece algo normal, pero es un logro espectacular. El siguiente paso ya está aquí. DeepL ha presentado DeepL Voice to voice, la traducción voz a voz en tiempo real: una persona habla en otro idioma, y tu escuchas su traducción en voz, y viceversa.

Aunque es el más utilizado, el mejor traductor de texto no es Google Translator, sino DeepL Translate. No soporta tantos idiomas como el Traductor de Google, pero en general las traducciones son más precisas, y ofrece diferentes estilos de traducción.

DeepL es una compañía alemana que destaca porque, al contrario que su competencia, que emplea redes neuronales recurrentes, utiliza redes neuronales convolucionales (RNC). Esto tiene sus pros y sus contras, pero DeepL compensa los puntos débiles con técnicas de apoyo. El resultado es superior al de la mayoría de traductores basados en inteligencia artificial.

Llega la traducción voz a voz en tiempo real

“Después de tantos años dedicados a la traducción de textos, dar el salto a la traducción de voz era un paso lógico para nosotros”, explica Jarek Kutylowski, CEO de DeepL, en una entrevista con TechCrunch. “Hemos avanzado mucho en lo que respecta a la traducción de textos y documentos. Pero pensábamos que no existía un buen producto para la traducción de voz en tiempo real”.

Kutylowski explica que la traducción de voz en tiempo real se enfrenta a dos fuerzas antagónicas: la latencia, y la precisión. La latencia es el retardo que se produce desde que una persona pronuncia una frase, hasta que se obtiene la traducción en voz o texto. No puede ser grande, porque entonces los diálogos no serían fluidos.

El problema es que la latencia va en contra de la precisión. Por cómo funciona la IA, requiere un tiempo para obtener la traducción y convertirla a voz. Como más tiempo le dedique la IA más precisa es la traducción, pero eso implica una mayor latencia. Si queremos un retardo pequeño, obtenemos una traducción de peor calidad.

DeepL cree haber alcanzado un equilibrio entre ambas: una traducción voz a voz de calidad, con una baja latencia.

La compañía alemana ha comenzado ofreciendo plugins para Zoom y Microsoft Teams, que traducen tanto voz a voz como voz a texto durante las videollamadas o reuniones online. La IA es capaz de traducir el audio a diferentes idiomas simultáneamente, para que cada participante lo escuche en su propio idioma.

De momento está en fase beta, y hay que apuntarse a una lista de espera para probarlo. También tienen pensado lanzar una API para que los desarrolladores integren esta traducción voz a voz en sus propias aplicaciones. Si tienes micrófono, puedes probar esta tecnología con unas pocas frases, en su web.



Fuentes:
https://computerhoy.20minutos.es/tecnologia/popular-traductor-texto-deepl-translate-ahora-traduce-voz-voz-tiempo-real_6959594_0.html

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.