Blog elhacker.NET: Gemini 2.5 Pro es el “modelo de IA más inteligente” de Google con pensamiento incorporado

Gemini 2.5 Pro es el “modelo de IA más inteligente” de Google con pensamiento incorporado

martes, 25 de marzo de 2025 | Publicado por el-brujo | Editar entrada

Después de las actualizaciones de los modelos disponibles para todos los usuarios, Google anunció hoy Gemini 2.5 Pro (experimental) para suscriptores y desarrolladores avanzados. Como antes, Google está haciendo otra actualización de mitad de año/modelo.

Gemini 2.5 presenta un “nuevo nivel de rendimiento al combinar un modelo base significativamente mejorado con una mejora posterior al entrenamiento”.

Lo de Google con Gemini es un no parar. La gran G está anunciando novedades para su IA prácticamente todas las semanas, permitiendo utilizar funciones de pago a los usuarios gratis, añadiendo más opciones a sus modelos e integrando características como los nuevos Canvas. El chatbot está viviendo su época dorada durante los primeros meses de 2025, y la compañía no pretende quedarse parada: acaba de integrar una de las funciones más increíbles, útiles y esperadas de su catálogo.

Gemini ya es capaz de utilizar la tecnología de Project Astra. Para los más perdidos, este es un proyecto que Google anunció hace cosa de un año y que permitía a la IA obtener contexto multimodal a través del vídeo. Es decir, que el chatbot ya puede ver qué haces en la pantalla de tu móvil o entender lo que muestra la cámara e interactuar con ese contenido.

En otras palabras, Gemini ahora tiene ojos y puede utilizarlos en tiempo real para solventar problemas, ofrecer contexto o dar información sobre una situación. Es una tecnología similar a la que anunció OpenAI hace un tiempo, y también una de las funciones IA más espectaculares, útiles y futuristas que un usuario final puede experimentar.

Los primeros benchmarks de Gemini 2.5 Pro son sorprendentes y superan con amplio margen los resultados de sus principales rivales. El más destacado es el de Humanity’s Last Exam, una prueba de 3.000 preguntas académicas sobre ciencias naturales, matemáticas y humanidades. Allí, la nueva IA de Google marcó un 18,8 % en la modalidad sin herramientas, superando a o3-mini (14 %), GPT-4.5 (6,4 %) y Claude 3.7 Sonnet (8,9 %).

En las pruebas de ciencia (GPQA Diamond) y matemática (AIME 2024/AIME 2025), también obtuvo mejores resultados que los modelos de la competencia. Y lo más relevante en tal sentido es que los logró en pruebas únicas, cuando otros modelos como Grok 3 beta y Claude 3.7 Sonnet requirieron de múltiples intentos para superarle en los benchmarks.

Gemini 2.5

En particular, todos los modelos de la familia Gemini 2.5, incluidos los futuros, son “modelos de pensamiento, capaces de razonar a través de sus pensamientos antes de responder, lo que resulta en un mejor rendimiento y una mayor precisión”. Google está “construyendo estas capacidades de pensamiento directamente en todos los (sus) modelos” para permitirles “manejar problemas más complejos y apoyar a los agentes aún más capaces y conscientes del contexto”.

En comparación con 2.0 Flash Thinking, que se reveló por primera vez en diciembre y recibió una actualización este mes, Google ya no adjunta explícitamente la etiqueta de “pensamiento”. Los usuarios pueden “mostrar pensamiento” en la aplicación Géminis para ver el tren del pensamiento.

En el campo de la IA, la capacidad de un “razonamiento” de un sistema se refiere a algo más que clasificación y predicción. Se refiere a su capacidad para analizar información, sacar conclusiones lógicas, incorporar contexto y matices, y tomar decisiones informadas.

Gemini 2.5 Pro (Gemini-2.5-Pro-Exp-03-25 y el llamado en código “Nebula”) es el primer modelo en esta familia. Dirigido a tareas complejas, Google señala cómo “encabeza la tabla de clasificación de Lmarena, que mide las preferencias humanas, por un margen significativo”. También lidera los puntos de referencia Math (AIME 2025) y Science (GPQA Diamond) “sin técnicas de tiempo de prueba que aumentan los costos, como la votación de la mayoría”.

También califica un 18.8% de última generación en modelos sin uso de herramientas en el último examen de la humanidad, un conjunto de datos diseñado por cientos de expertos en la materia para capturar la frontera humana del conocimiento y el razonamiento.

También hay un enfoque en la codificación avanzada con un “gran salto sobre 2.0” y “más mejoras por venir”.

“2.5 Pro sobresale en la creación de aplicaciones web visualmente convincentes y aplicaciones de código de agente, junto con la transformación y edición del código”. “En el bancario SWE verificado, el estándar de la industria para el código de agente Evals, Gemini 2.5 Pro obtiene un 63.8% con una configuración de agente personalizado”.

Además de la multimodalidad nativa, Gemini 2.5 Pro tiene una ventana de contexto de 1 millón de tokens con 2 millones próximos.

Puede comprender grandes conjuntos de datos y manejar problemas complejos de diferentes fuentes de información, incluidos texto, audio, imágenes, video e incluso repositorios de código enteros.

Gemini 2.5 Pro (Experimental) se está implementando primero en Gemini Advanced y Google AI Studio, con Vertex AI después en las próximas semanas.

También introduciremos los precios en las próximas semanas, lo que permite a las personas usar 2.5 Pro con límites de velocidad más altos para el uso de producción escalada.

En la aplicación Gemini, reemplaza el 2.0 Pro (experimental) del mes pasado con acceso a aplicaciones (@GMail, @youtube, etc.) y cargas de archivos.

Gemini ya puede ver tu pantalla y tu cámara

Gemini ha integrado Project Astra de la forma más sencilla y útil posible. La esencia de la tecnología es poder analizar vídeo en tiempo real y crear conversaciones en torno a él, por lo que ha incluido dos nuevas funciones que permiten sacarle partido a esta característica.

Grabación de pantalla en tiempo real. Gemini ahora cuenta con un nuevo botón para iniciar una grabación de pantalla y que el chatbot pueda ver todo lo que haces en tu móvil e interactuar contigo en tiempo real. Una vez se activa, puedes navegar por una web, jugar o ver un vídeo y hacerle preguntas a Gemini sobre el contenido que se está mostrando. Las posibilidades, como puedes imaginar, son infinitas: pueden ayudarte a comprender mejor cierto tema, qué es exactamente lo que estás viendo en una imagen o guiarte a través de la interfaz de tu móvil para resolver un problema.
Acceso al contenido de la cámara. Gemini también tiene acceso a la cámara de tu móvil para mejorar la función Live del chatbot. Dentro de poco, ya no solo podrás conversar a través de la voz, también podrás iniciar la cámara de tu móvil y que la conversación gire en torno a lo que muestra. Todo en tiempo real.

Este último detalle es increíble. Permite que Gemini Live tenga acceso a un nuevo método de entrada como es el vídeo en tiempo real, lo que abre la puerta a un uso de la IA muchísimo más avanzado y útil. El modo conversacional ya era una maravilla, pero ahora que el vídeo tiene cabida es posible utilizar Gemini de una forma completamente nueva y superútil.

Lamentablemente, los usuarios que ya están pudiendo probar estas funciones están suscritos a Google One. Es decir, que por el momento parece que las cuentas gratuitas de Gemini no van a tener acceso al contexto a través del vídeo. Es una función que requiere una buena cantidad de recursos, por lo que es totalmente normal que Google la destine, por ahora, solo a los que pasan por caja.

Si estás dentro de este grupo, mantén la aplicación de Gemini actualizada, pues en cuestión de horas deberías empezar a visualizar las nuevas funciones de vídeo al abrir la app. Y, si no pagas por Gemini Advanced, solo te queda esperar a que Google decida permitir el uso gratuito de esta característica. Si es que lo hace, claro.

Por supuesto que Gemini 2.5 es una inteligencia artificial multimodal, por lo que puede lidiar con múltiples formatos. En el caso de la versión Pro, Google indica que puede resolver problemas complejos y comprender sets de datos de gran tamaño, incluyendo fotos, vídeos, textos, audios y repositorios de código completos. Eso sí, el método de salida por ahora se limita a texto.

Los usuarios de Gemini 2.5 Pro ya disponen de una ventana de contexto de hasta un millón de tokens. Esto es más que suficiente para una cantidad enorme de casos de uso, considerando que equivale a unas 750.000 palabras, aproximadamente. No obstante, los de Mountain View prometen ampliarla a dos millones de tokens en próximas semanas.

Quienes estén suscriptos a Gemini Advanced, que cuesta 20 dólares por mes, ya pueden probar la versión experimental de la nueva IA tanto desde la app de Gemini como a través de la web. Asimismo, es posible utilizarla en Google AI Studio y pronto se sumará a la plataforma de Vertex AI.

En lo que respecta a la API de Gemini 2.5 Pro, Google aún no ha revelado su esquema de precios. Aun así, puedes conocer más sobre sus características en el sitio para desarrolladores de Google AI.

Fuentes:

https://www.lavelez.com.ar/technology/gemini-2-5-pro-es-el-modelo-de-ia-mas-inteligente-de-google-con-pensamiento-incorporado/6884/

https://hipertextual.com/2025/03/gemini-estrena-su-modo-dios-ya-puedes-probar-la-funcion-ia-mas-futurista-y-util-del-momento

Etiquetas: gemini , google , inteligencia artificial

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

Gemini 2.5 Pro es el “modelo de IA más inteligente” de Google con pensamiento incorporado

Gemini 2.5

Gemini ya puede ver tu pantalla y tu cámara

0 comentarios :

Publicar un comentario