Google ha mejorado significativamente Gemini 2.5 Flash con Audio Native, logrando conversaciones de voz más fluidas y precisas, además de una mejor gestión del contexto en las interacciones.
Gemini 2.5 Flash Native Audio mejora la naturalidad de las conversaciones, la precisión en instrucciones y la gestión de contextos en las interacciones de voz de Google.
Google ha anunciado una actualización importante para Gemini 2.5 Flash Native Audio, que hace que las interacciones de voz con sus asistentes sean más naturales, fluidas y fiables.
Aunque Gemini ya ofrecía una experiencia cercana a la de una conversación humana, aún necesitaba mejoras en la calidad de las interacciones. Esta nueva versión se centra en tres áreas clave.
Por una parte va a ofrecer llamadas más precisas dado que Gemini ahora puede identificar con mayor exactitud cuándo necesita recabar información en tiempo real durante una conversación y luego incluir esos datos en sus respuestas de audio de forma fluida.
Hará un mejor seguimiento de instrucciones dado que el modelo ahora cumple con las indicaciones de los desarrolladores con mayor claridad, lo que le permite manejar instrucciones complejas y entregar resultados más fiables.
Conversaciones más fluidas dado que Gemini 2.5 puede recuperar mejor el contexto de puntos anteriores en la conversación, permitiendo mantener diálogos más cohesionados a lo largo del tiempo.
Google afirma que esta actualización busca hacer que el modelo sea más capaz de gestionar flujos de trabajo complejos, seguir instrucciones con precisión y mantener conversaciones naturales con los usuarios.
Fuentes:
https://computerhoy.20minutos.es/tecnologia/google-mejora-gemini-maximo-con-conversaciones-mas-fluidas-precisas-con-voz_6910309_0.html

No hay comentarios:
Publicar un comentario