Blog elhacker.NET: DiffusionGemma: la IA de Google que prioriza la velocidad

DiffusionGemma: la IA de Google que prioriza la velocidad

jueves, 11 de junio de 2026 | Publicado por el-brujo | Editar entrada

Google ha lanzado DiffusionGemma, un modelo de IA abierta que prioriza la velocidad en GPU local sobre la calidad, buscando competir en el ámbito de los modelos abiertos.

Google ha lanzado DiffusionGemma, un nuevo modelo de inteligencia artificial de código abierto diseñado específicamente para maximizar la velocidad de procesamiento en GPU locales. A diferencia de Gemma 4, este sistema prioriza la rapidez sobre la calidad de generación de texto, buscando así ganar ventaja competitiva en el sector de los modelos abiertos frente a los desarrollos de China.

Google ha presentado sin armar mucho ruido su nueva IA DiffusionGemma, un modelo abierto que cambia la forma de generar texto para priorizar velocidad en GPU local, incluso aceptando una pérdida de calidad frente a Gemma 4. El movimiento de la gran G encaja mejor dentro del pulso de modelos abiertos que están empujando desde China, con Qwen o DeepSeek como referencias inevitables, más que dentro de una comparación directa con GPT o Claude, donde la batalla se libra con modelos cerrados de máxima calidad. Dicho esto, veamos qué trae al mercado para todos aquellos que trabajan en local con modelos abiertos.

La clave está en que DiffusionGemma no intenta ser el modelo más potente de Google, sino una vía distinta para acelerar la IA local. En vez de escribir token a token de izquierda a derecha, genera bloques completos de texto y los refina mediante difusión, una aproximación que Google presenta como especialmente útil para flujos rápidos e interactivos. Y esto, que parece irrelevante a primera vista, lo va a cambiar todo.

Google DiffusionGemma, la IA que acaba de dejar a China varios años por detrás en un solo movimiento

El modelo parte de la base conseguida con Gemma 4 26B A4B, una arquitectura MoE con 25,2B parámetros totales y 3,8B parámetros activos que gusta mucho a usuarios y profesionales. Esa diferencia importa, porque permite manejar un modelo grande sobre el papel sin activar todo su peso en cada inferencia, algo especialmente relevante cuando hablamos de ejecución local, estaciones de trabajo o GPU de consumo de alto rendimiento.

Google también indica soporte para contexto de hasta 256K tokens, formato BF16 y cuantización NVFP4, con un objetivo claro de reducir memoria y acelerar despliegues. La generación por difusión trabaja con un canvas de 256 tokens, donde el sistema no va completando una respuesta palabra a palabra como estamos acostumbrados en GPT o Claude, sino que crea un bloque, lo revisa, lo limpia y lo deja cerrado antes de pasar al siguiente.

Este enfoque permite mirar el bloque completo durante el proceso, corregir partes internas y aprovechar mejor la capacidad paralela de una GPU, que es justo donde Google sitúa su ventaja frente a los modelos autoregresivos tradicionales, y sobre todo los de China. De hecho, los acaba de dejar a años atrás cuando estos se estaban acercando, todo en un movimiento.

Rendimiento brutal, mejor aprovechamiento de tu GPU, apenas una pequeña regresión en calidad

Los datos de rendimiento que da Google son agresivos, porque DiffusionGemma promete hasta 4x más velocidad en GPU dedicadas, con más de 1.000 tokens por segundo en una NVIDIA H100 y más de 700 tokens por segundo en una RTX 5090. También se habla de despliegues dentro de unos 18 GB de VRAM con cuantización, una cifra que lo acerca al terreno de la IA local de alto rendimiento para PC y portátiles.

La contrapartida está reconocida por la propia Google, ya que Gemma 4 autoregresivo sigue siendo la opción recomendada cuando se busca máxima calidad, principalmente porque los benchmarks oficiales colocan a DiffusionGemma por debajo en pruebas como MMLU Pro, AIME 2026, LiveCodeBench, GPQA Diamond, visión y contexto largo. La propuesta, por tanto, no consiste en superar a los modelos frontier cerrados como GPT y Claude, sino en ofrecer una alternativa abierta, rápida y ajustable para PC, WS y portátiles, extremadamente rápida, muy fiable, sin ser la mejor opción en este campo.

Ese matiz es el que conecta con China y sus IA. El ecosistema chino ha presionado mucho con modelos abiertos, descargables y competitivos, mientras OpenAI y Anthropic siguen defendiendo productos cerrados por API. DiffusionGemma entra justo en ese terreno: pesos abiertos, licencia Apache 2.0, ejecución local, soporte para texto, imagen y vídeo procesado como frames, además de usos como OCR, documentos, pantallas, código y edición interactiva. Es la alternativa que destruye el mercado a base de pura difusión contra inferencia, es más rápida que un regate de Messi en el área chica, o la primera zancada de Mbappé, no hay nada igual en términos de velocidad y rendimiento para tu GPU.

Igualmente, y como era de esperar, Google no ha dicho que DiffusionGemma sea una respuesta directa a China, pero el producto compite en el mismo tablero donde los modelos abiertos chinos han ganado visibilidad y usuarios. La pregunta ahora es si esta velocidad por difusión será una rareza técnica o el primer paso hacia asistentes locales mucho más rápidos, aunque todavía menos finos que los grandes modelos cerrados. Y por supuesto, ¿cuánto va a tardar China y sus empresas en copiarlo por destilación? Seguramente no mucho.

Fuentes:
https://elchapuzasinformatico.com/2026/06/google-diffusiongemma-ia/

Etiquetas: diffusiongemma , google , gpu , ia , modelo , velocidad

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

DiffusionGemma: la IA de Google que prioriza la velocidad

Google DiffusionGemma, la IA que acaba de dejar a China varios años por detrás en un solo movimiento

Rendimiento brutal, mejor aprovechamiento de tu GPU, apenas una pequeña regresión en calidad

0 comentarios :

Publicar un comentario