Blog elhacker.NET: DeepSeek Janus-Pro-7B, otro modelo de IA multimodal, open source, que supera a DALL-E en creación de imágenes

DeepSeek Janus-Pro-7B, otro modelo de IA multimodal, open source, que supera a DALL-E en creación de imágenes

martes, 28 de enero de 2025 | Publicado por el-brujo | Editar entrada

DeepSeek ha lanzado otro nuevo modelo de IA, hoy lunes 27, también de código abierto: Janus-Pro-7B, destacado por el experto Rowan Cheung por sus capacidades multimodales, incluyendo la generación de imágenes, superando a modelos como DALL-E 3 y Stable Diffusion en benchmarks como GenEval y DPG-Bench.

Sus desarrolladores indican que Janus Pro 7B genera resultados mucho más precisos que los de DALL-E 3, Stable Difussion XL, Emu3-Gen y PixArt-a, entre otros, en las pruebas de rendimiento DPG-Bench y GenEval. Sin embargo, lo nuevo de DeepSeek no está libre de algunas limitaciones notorias.

El lunes, DeepSeek presentó su último modelo de IA de código abierto, Janus-Pro-7B, que ha sido destacado por el observador de IA Rowan Cheung por sus capacidades multimodales, incluyendo la generación de imágenes. Según Cheung, el modelo supera el rendimiento de DALL-E 3 de OpenAI y Stable Diffusion en benchmarks establecidos como GenEval y DPG-Bench. Este anuncio se suma a la expectación existente en torno al R1, otro desarrollo de IA de DeepSeek que ha estado provocando importantes alteraciones en el mercado de acciones tecnológicas hoy.

La innovación. El modelo introduce un sistema de "doble vía" para el procesamiento visual:

Separa los caminos de codificación para entender y generar imágenes.
Mantiene un único transformer para procesar toda la información.
Utiliza SigLIP-L como codificador visual para imágenes de 384x384 píxeles.

Esta resolución es su principal inconveniente, parece mucho más orientada a experimentar y a usos de poca ambición que a las aplicaciones que podemos asumir de otras propuestas como Midjourney o Freepik, que suelen partir de 1024x1024 píxeles. No obstante, Janus Pro no es un generador de imágenes al uso, sino un modelo multimodal con varias capacidades.

La arquitectura de Janus Pro 7B es especialmente relevante por su eficiencia:

Tamaño compacto de 7.000 millones ("7B") de parámetros.
Rendimiento superior a modelos específicos más grandes.
Código abierto bajo licencia MIT para el repositorio, aunque el modelo en sí requiere aceptar la licencia DeepSeek.

La licencia MIT permite a cualquiera usar, modificar y distribuir el código libremente, incluso con fines comerciales, siempre que se mantenga el aviso de copyright original. Es una de las licencias más permisivas que existen.

La licencia DeepSeek, en cambio, es gratuita y permite usos comerciales, pero incluye restricciones éticas específicas, como la prohibición de uso militar o la generación de desinformación.

Las avanzadas capacidades de Janus-Pro-7B llegan en un momento en que la industria de la IA evoluciona a pasos agigantados, con empresas compitiendo por lanzar modelos capaces de manejar una amplia gama de tareas. La habilidad de Janus-Pro-7B para generar imágenes lo sitúa como un competidor directo de algunos de los modelos de IA más destacados del mercado actual. Las observaciones de Cheung sugieren que el nuevo modelo de DeepSeek podría establecer un nuevo estándar en el rendimiento de la IA.

El lanzamiento de Janus-Pro-7B y el continuo revuelo en torno al R1 han tenido un impacto significativo en el desempeño financiero del sector tecnológico. Las acciones han mostrado una gran volatilidad mientras los inversores y los actores de la industria evalúan las posibles implicaciones de estos avances en IA. El efecto inmediato en el mercado refleja la sensibilidad de las acciones tecnológicas a las innovaciones y las altas expectativas sobre el papel de la IA en el futuro de la tecnología. NVIDIA (NASDAQ:NVDA), por ejemplo, ha experimentado una caída de más del 17% al acercarse el mediodía en Wall Street.

Los benchmarks mencionados por Cheung, GenEval y DPG-Bench, son fundamentales para medir la eficacia y versatilidad de los modelos de IA. Superar estos benchmarks indica que Janus-Pro-7B tiene una ventaja competitiva en tareas de IA, lo que podría influir en la dirección de la investigación y el desarrollo futuros en este campo.

Mientras la industria tecnológica asimila la introducción de Janus-Pro-7B y sus implicaciones, la atención ahora se centra en cómo responderán otras empresas a los avances de DeepSeek. Con el panorama de la IA en constante evolución, es probable que la competencia se intensifique, lo que conducirá a más innovaciones y posiblemente a mayores fluctuaciones del mercado a medida que surjan nuevos modelos.

Fuentes:

https://github.com/deepseek-ai/Janus

https://huggingface.co/deepseek-ai/Janus-Pro-7B

https://es.investing.com/news/stock-market-news/deepseek-lanza-otro-modelo-de-ia-de-codigo-abierto-en-medio-de-la-turbulencia-de-las-acciones-tecnologicas-93CH-2989915

https://www.xataka.com/robotica-e-ia/poner-reves-industria-ia-deepseek-lanza-su-primer-modelo-que-entiende-crea-imagenes-janus-pro

https://hipertextual.com/2025/01/deepseek-lanza-janus-pro-su-ia-para-crear-imagenes-desde-texto

Etiquetas: dall-e , deepseek , inteligencia artificial , janus

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

DeepSeek Janus-Pro-7B, otro modelo de IA multimodal, open source, que supera a DALL-E en creación de imágenes

0 comentarios :

Publicar un comentario