Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon Gemini 2.5 Pro es el “modelo de IA más inteligente” de Google con pensamiento incorporado


Después de las actualizaciones de los modelos disponibles para todos los usuarios, Google anunció hoy Gemini 2.5 Pro (experimental) para suscriptores y desarrolladores avanzados. Como antes, Google está haciendo otra actualización de mitad de año/modelo.



  •  Gemini 2.5 presenta un “nuevo nivel de rendimiento al combinar un modelo base significativamente mejorado con una mejora posterior al entrenamiento”.

 

Lo de Google con Gemini es un no parar. La gran G está anunciando novedades para su IA prácticamente todas las semanas, permitiendo utilizar funciones de pago a los usuarios gratis, añadiendo más opciones a sus modelos e integrando características como los nuevos Canvas. El chatbot está viviendo su época dorada durante los primeros meses de 2025, y la compañía no pretende quedarse parada: acaba de integrar una de las funciones más increíbles, útiles y esperadas de su catálogo.  

Gemini ya es capaz de utilizar la tecnología de Project Astra. Para los más perdidos, este es un proyecto que Google anunció hace cosa de un año y que permitía a la IA obtener contexto multimodal a través del vídeo. Es decir, que el chatbot ya puede ver qué haces en la pantalla de tu móvil o entender lo que muestra la cámara e interactuar con ese contenido.

En otras palabras, Gemini ahora tiene ojos y puede utilizarlos en tiempo real para solventar problemas, ofrecer contexto o dar información sobre una situación. Es una tecnología similar a la que anunció OpenAI hace un tiempo, y también una de las funciones IA más espectaculares, útiles y futuristas que un usuario final puede experimentar. 

Gemini 2.5

En particular, todos los modelos de la familia Gemini 2.5, incluidos los futuros, son “modelos de pensamiento, capaces de razonar a través de sus pensamientos antes de responder, lo que resulta en un mejor rendimiento y una mayor precisión”. Google está “construyendo estas capacidades de pensamiento directamente en todos los (sus) modelos” para permitirles “manejar problemas más complejos y apoyar a los agentes aún más capaces y conscientes del contexto”.

En comparación con 2.0 Flash Thinking, que se reveló por primera vez en diciembre y recibió una actualización este mes, Google ya no adjunta explícitamente la etiqueta de “pensamiento”. Los usuarios pueden “mostrar pensamiento” en la aplicación Géminis para ver el tren del pensamiento.

En el campo de la IA, la capacidad de un “razonamiento” de un sistema se refiere a algo más que clasificación y predicción. Se refiere a su capacidad para analizar información, sacar conclusiones lógicas, incorporar contexto y matices, y tomar decisiones informadas.

 

 

Gemini 2.5 Pro (Gemini-2.5-Pro-Exp-03-25 y el llamado en código “Nebula”) es el primer modelo en esta familia. Dirigido a tareas complejas, Google señala cómo “encabeza la tabla de clasificación de Lmarena, que mide las preferencias humanas, por un margen significativo”. También lidera los puntos de referencia Math (AIME 2025) y Science (GPQA Diamond) “sin técnicas de tiempo de prueba que aumentan los costos, como la votación de la mayoría”.

También califica un 18.8% de última generación en modelos sin uso de herramientas en el último examen de la humanidad, un conjunto de datos diseñado por cientos de expertos en la materia para capturar la frontera humana del conocimiento y el razonamiento.


 

También hay un enfoque en la codificación avanzada con un “gran salto sobre 2.0” y “más mejoras por venir”.

“2.5 Pro sobresale en la creación de aplicaciones web visualmente convincentes y aplicaciones de código de agente, junto con la transformación y edición del código”. “En el bancario SWE verificado, el estándar de la industria para el código de agente Evals, Gemini 2.5 Pro obtiene un 63.8% con una configuración de agente personalizado”.




 

Además de la multimodalidad nativa, Gemini 2.5 Pro tiene una ventana de contexto de 1 millón de tokens con 2 millones próximos.

Puede comprender grandes conjuntos de datos y manejar problemas complejos de diferentes fuentes de información, incluidos texto, audio, imágenes, video e incluso repositorios de código enteros.

Gemini 2.5 Pro (Experimental) se está implementando primero en Gemini Advanced y Google AI Studio, con Vertex AI después en las próximas semanas.

También introduciremos los precios en las próximas semanas, lo que permite a las personas usar 2.5 Pro con límites de velocidad más altos para el uso de producción escalada.

En la aplicación Gemini, reemplaza el 2.0 Pro (experimental) del mes pasado con acceso a aplicaciones (@GMail, @youtube, etc.) y cargas de archivos.

 

Gemini ya puede ver tu pantalla y tu cámara

Gemini ha integrado Project Astra de la forma más sencilla y útil posible. La esencia de la tecnología es poder analizar vídeo en tiempo real y crear conversaciones en torno a él, por lo que ha incluido dos nuevas funciones que permiten sacarle partido a esta característica. 

  • Grabación de pantalla en tiempo real. Gemini ahora cuenta con un nuevo botón para iniciar una grabación de pantalla y que el chatbot pueda ver todo lo que haces en tu móvil e interactuar contigo en tiempo real. Una vez se activa, puedes navegar por una web, jugar o ver un vídeo y hacerle preguntas a Gemini sobre el contenido que se está mostrando. Las posibilidades, como puedes imaginar, son infinitas: pueden ayudarte a comprender mejor cierto tema, qué es exactamente lo que estás viendo en una imagen o guiarte a través de la interfaz de tu móvil para resolver un problema.
  • Acceso al contenido de la cámara. Gemini también tiene acceso a la cámara de tu móvil para mejorar la función Live del chatbot. Dentro de poco, ya no solo podrás conversar a través de la voz, también podrás iniciar la cámara de tu móvil y que la conversación gire en torno a lo que muestra. Todo en tiempo real. 

Este último detalle es increíble. Permite que Gemini Live tenga acceso a un nuevo método de entrada como es el vídeo en tiempo real, lo que abre la puerta a un uso de la IA muchísimo más avanzado y útil. El modo conversacional ya era una maravilla, pero ahora que el vídeo tiene cabida es posible utilizar Gemini de una forma completamente nueva y superútil.

Lamentablemente, los usuarios que ya están pudiendo probar estas funciones están suscritos a Google One. Es decir, que por el momento parece que las cuentas gratuitas de Gemini no van a tener acceso al contexto a través del vídeo. Es una función que requiere una buena cantidad de recursos, por lo que es totalmente normal que Google la destine, por ahora, solo a los que pasan por caja.

Si estás dentro de este grupo, mantén la aplicación de Gemini actualizada, pues en cuestión de horas deberías empezar a visualizar las nuevas funciones de vídeo al abrir la app. Y, si no pagas por Gemini Advanced, solo te queda esperar a que Google decida permitir el uso gratuito de esta característica. Si es que lo hace, claro.

 

 

Fuentes:

https://www.lavelez.com.ar/technology/gemini-2-5-pro-es-el-modelo-de-ia-mas-inteligente-de-google-con-pensamiento-incorporado/6884/

https://hipertextual.com/2025/03/gemini-estrena-su-modo-dios-ya-puedes-probar-la-funcion-ia-mas-futurista-y-util-del-momento 


0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.