-
▼
2025
(Total:
470
)
-
▼
marzo
(Total:
157
)
-
Telegram supera los mil millones de usuarios
-
Cómo un exploit de la NSA se convirtió en el orige...
-
¿Qué es JPEG XL?
-
¿Qué son los shaders y por qué debes esperar antes...
-
Neurodatos: qué son y por qué son el futuro
-
¿Qué es un ASIC?
-
Calibre 8.1 mejora su compatibilidad con macOS e i...
-
Alcasec vendió datos sensibles de 130.000 policías...
-
Hackean un proveedor de SMS y lo utilizan para rob...
-
Filtración masiva de 6 millones registros de Oracl...
-
Vulnerabilidades críticas en Veeam Backup e IBM AIX
-
IngressNightmare: vulnerabilidades críticas del co...
-
El 87% de lo usuarios hace copias de seguridad, pe...
-
Vulnerabilidad crítica en Next.js
-
Hacker antigobierno hackea casi una decena de siti...
-
Google confirma que el desarrollo de Android pasar...
-
Ubuntu 25.04 beta ya disponible, con GNOME 48 y Li...
-
Anthropic asegura haber descubierto cómo ‘piensan’...
-
ChatGPT, Gemini y Claude no pueden con un test que...
-
Amazon presenta ‘Intereses’ una IA que caza oferta...
-
Microsoft rediseña el inicio de sesión para que te...
-
¿Qué significa «in the coming days»? la tendencia ...
-
Por culpa de Trump, empresas y gobiernos europeos ...
-
Signal es seguro… hasta que invitas a un periodist...
-
ChatGPT puede crear imágenes realistas gracias al ...
-
Evolución del menú de inicio de Windows en casi 3...
-
Gemini 2.5 Pro es el “modelo de IA más inteligente...
-
DeepSeek presenta un nuevo modelo de IA optimizado...
-
Samsung y Google tienen casi listas sus gafas con ...
-
⚡️ NVMe sobre TCP/IP
-
🇰🇵 Corea del Norte se prepara para la ciberguerr...
-
🇨🇳 Los creadores de Deepseek tienen prohibido ir...
-
Microsoft usará agentes autónomos de IA para comba...
-
EU OS: La nueva alternativa Linux comunitaria para...
-
China presenta un arma capaz de cortar cualquier c...
-
Historia de Apple
-
Microsoft le dice a los usuarios de Windows 10 que...
-
ReactOS el «Windows de código abierto», se actualiza
-
Denuncia a OpenAI después de que ChatGPT le acusar...
-
💾 Seagate presenta un disco duro mecánico con int...
-
🤖 Claude ya permite buscar en internet para obten...
-
Meta AI llega finalmente a Europa, integrando su c...
-
Francia rechaza la creación de puertas traseras en...
-
🤖Cómo saber si una imagen o vídeo ha sido generad...
-
OpenAI presenta dos nuevos modelos de audio para C...
-
El cofundador de Instagram revela a lo que se dedi...
-
Vigilancia masiva con sistemas de posicionamiento ...
-
Las 20 mejores herramientas de Kali Linux para 2025
-
Cómo instalar Stable Diffusion (para generar imáge...
-
La primera versión de Kali Linux de 2025
-
Marruecos: más de 31,000 tarjetas bancarias divulg...
-
Modo Dios en Android Auto
-
Google anuncia el Pixel 9a, con funciones de IA, e...
-
Europa fuerza a Apple a abrir su ecosistema y acus...
-
La App Contraseñas de Apple fue durante tres meses...
-
Adiós, Photoshop: Gemini ahora te permite editar i...
-
Microsoft alerta de un troyano que desde Chrome ro...
-
Llevan meses explotando una vulnerabilidad de Chat...
-
Teclado que no utiliza letras, sino palabras compl...
-
La GPU se une a los discos duros basados en PCIe: ...
-
Un ciberataque compromete 330 GB de datos confiden...
-
NVIDIA presenta los modelos de razonamiento de IA ...
-
La mítica marca Española de calzado J´Hayber vícti...
-
La RAE confirma haber sufrido un ataque de ransomware
-
NVIDIA BlackWell RTX PRO 6000 con 96 GB de VRAM y ...
-
China construye una base submarina a 2 km de profu...
-
Los creadores de Stable Diffusion presentan una IA...
-
Utilizan una vulnerabilidad crítica en dispositivo...
-
Vulnerabilidad de suplantación en el Explorador de...
-
NVIDIA Isaac GR00T N1, la primera IA de código abi...
-
Campaña de Phishing: "Alerta de seguridad" FALSA e...
-
🔈Amazon Echo: o cedes tus datos y privacidad a la...
-
Descifrador del ransomware Akira mediante GPU
-
Google compra Wiz por 32.000 millones de dólares, ...
-
Una nueva técnica envía sonido a una persona espec...
-
GIMP 3: ya puedes descargar la nueva versión del e...
-
“Hackearon mi teléfono y mi cuenta de correo elect...
-
Generar imágenes mediante IA con Stable Diffusion
-
Steve Wozniak alerta del uso de la IA como «herram...
-
La IA de código abierto iguala a los mejores LLM p...
-
Grupo Lazarus de Corea del Norte hizo el mayor rob...
-
El FBI y CISA alertan ante el aumento de los ataqu...
-
Android 16 incluirá Battery Health
-
SteamOS para PC, la alternativa a Windows
-
Venden acceso total a red de gasolineras de México...
-
Ransomware Akira cifró los datos desde una cámara ...
-
ASUS anuncia monitores con purificador de aire inc...
-
Facebook, Instagram y Threads empiezan a probar la...
-
Texas Instruments crea el microcontrolador más peq...
-
Algunas impresoras están imprimiendo texto aleator...
-
Deep Research, la herramienta de Gemini que convie...
-
La nueva versión de Visual Studio Code te permite ...
-
Las descargas de LibreOffice se disparan con el re...
-
China anuncia una nueva tecnología que permite ver...
-
Google anuncia Gemma 3: su nueva IA ligera para di...
-
Gemini puede usar tu historial de Google para dart...
-
MySQL Replication (Master-Slave)
-
Advierten sobre Grandoreiro, troyano brasileño que...
-
Retan a ChatGPT y DeepSeek a jugar al ajedrez y lo...
-
Una actualización de HP deja inservibles a sus imp...
-
-
▼
marzo
(Total:
157
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
- El robo del siglo: así perpetró Corea del Norte el mayor hurto de activos digitales de la historia para financiar su pro
- Nuevo DNI digital: cómo funciona y cuándo será posible llevar el DNI en el móvil
- Trump restó importancia a la filtración de planes militares de EEUU en un chat
- Corea del Norte prepara un ejército de hackers: especializados en IA para espiar a Occidente
- Elon Musk cobra la API de Twitter (X) a precio de oro: esta app te permite usarla gratis
Entradas populares
-
El joven facilitó datos de 22 guardias civiles a la banda, que realizó seguimientos, colocó balizas y tendió trampas a los agentes que les i...
-
Conectarse a un dispositivo remoto, ver lo que le ocurre y hasta controlarlo a distancia son tres de las cualidades que poseen aplicacione...
-
Una empresa de ciberseguridad ha "descubierto" una importante filtración de datos que presuntamente contiene más de 200 millones...
Adiós, Photoshop: Gemini ahora te permite editar imágenes de forma conversacional y gratis
La semana pasada, Google le dio un buen repaso a la oferta de LLM (Grandes Modelos de Lenguaje) en Gemini. Los usuarios de cuentas gratuitas dijeron adiós a los modelos 1.5 y la bienvenida a 2.0 Flash, 2.0 Flash Thinking (experimental), las Gems de Gemini y la función Deep Research, mientras que los suscriptores de Gemini Advanced ganaron el modelo 2.0 Pro (Experimental). Entre todas estas novedades, pasó desapercibido que Gemini 2.0 Flash pasaba a contar con generación nativa de imágenes, pero con una diferencia muy importante frente a competidores como ChatGPT, que las crea mediante DALL-E: no solo genera imágenes a partir de un prompt, sino que el usuario también puede subirlas y editarlas. Como si estuviera usando Photoshop, pero mediante lenguaje natural y pidiéndole con instrucciones escritas lo que quiere en cada momento. No es una capacidad aún perfecta, pero sí funciona razonablemente bien y pone la edición de imágenes al alcance de cualquiera, sin necesidad de ningún software caro y complicado de usar.
- Gemini 2.0 Flash (Image Generation) Experimental es el primer LLM conversacional que genera imágenes de forma nativa y está disponible para todos los usuarios de cuentas de Google en Google AI Studio.
Cómo acceder al Photoshop conversacional de Gemini
Gemini 2.0 Flash (Image Generation) Experimental no está disponible en la web o la app de Gemini, sino a través de Google AI Studio. Probablemente porque Google está escarmentada de su primer intento de dotar a Gemini de capacidades generativas de imagen, que se saldó hace un año con su suspensión por ser demasiado woke.
Google AI Studio
es una plataforma de desarrollo de inteligencia artificial que permite a
los desarrolladores crear y entrenar modelos de aprendizaje automático
de manera más sencilla y eficiente, pero que cualquiera con una
cuenta de Google puede utilizar de forma gratuita y aprovechar el acceso
que da a una larga lista de modelos de lenguaje de Google. Lo único que tienes que hacer es seleccionar en el menú Model, en la columna de la izquierda, la opción Gemini 2.0 Flash (Image Generation) Experimental.
Este modelo de lenguaje saltó a los titulares por su capacidad para eliminar marcas de agua en fotografías, lo que evidentemente supone un problema para empresas como Shutterstock o Getty Images. Las sustituye por una marca SynthID, tecnología desarrollada por Google DeepMind que permite identificar imágenes generadas o modificadas mediante IA, reemplazando así la marca de agua original por una de Editado con IA. Dista de ser un método confiable, dado que también es posible eliminar marcas de IA con herramientas de IA.
Qué puedes hacer en las imágenes mediante instrucciones escritas
Pero por lo que resulta rompedor es por permitir a los usuarios editar imágenes como si estuvieran utilizando Photoshop, aunque mediante una interfaz de lenguaje natural intuitiva. Con solo pedírselo por escrito, Gemini 2.0 Flash puede agregar objetos, eliminarlos, modificar escenarios, cambiar la iluminación, ajustar los ángulos, acercar o alejar la imagen y realizar otras transformaciones, respetando la coherencia del mundo representado.
Photoshop no está al margen de la revolución IA, y Adobe ha ido añadiendo capacidades de este tipo a sus herramientas en los últimos meses. La función Relleno generativo permite manipular imágenes mediante instrucciones escritas, pero su uso no resulta tan natural como Gemini 2.0 Flash.
Los resultados no siempre ofrecen la misma calidad, pero Gemini 2.0 Flash es un modelo ligero diseñado para responder de forma rápida y consumiendo pocos recursos. No es tan potente como la versión completa, pero está dando sus primeros pasos en la generación de imágenes, y lo esperable es ver cómo mejoran sus resultados en futuras iteraciones.
Diferencia entre la generación de imágenes en Gemini 2.0 Flash y otros modelos
La diferencia entre la generación de imágenes de Gemini 2.0 Flash y otros modelos como ChatGPT es que mientras en este último se recurre a un modelo de IA independiente basado en tecnología de difusión (DALL-E en el caso de OpenAI, que utiliza un principio de síntesis diferente al de los LLM) para generar imágenes, que luego se muestran al usuario dentro de la interfaz de chat, Gemini 2.0 Flash es tanto el modelo de lenguaje grande como el generador de imágenes de IA en un solo sistema.
OpenAI avanzó el año pasado que GPT-4o también era capaz de generar imágenes de forma nativa, pero esta capacidad no se ha llevado aún al producto final.
Probablemente por el alto coste computacional y los riesgos
relacionados con la seguridad que presenta la generación de imágenes con
IA.
Otros aspectos en los que destaca la generación de imágenes de Gemini 2.0 Flash (Image Generation) Experimental son mantener la consistencia de los personajes a través de imágenes sucesivas y la representación de texto, aspectos en los que otros modelos todavía tienen serias dificultades.
Entradas relacionadas:






0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.