Tutoriales y Manuales
Entradas Mensuales
-
▼
2025
(Total:
387
)
-
▼
marzo
(Total:
110
)
-
Las 20 mejores herramientas de Kali Linux para 2025
-
Cómo instalar Stable Diffusion (para generar imáge...
-
Ya está aquí la primera versión de Kali Linux de 2025
-
Marruecos: más de 31,000 tarjetas bancarias divulg...
-
Modo Dios en Android Auto
-
Google anuncia el Pixel 9a, con funciones de IA, e...
-
Europa fuerza a Apple a abrir su ecosistema y acus...
-
La App Contraseñas de Apple fue durante tres meses...
-
Adiós, Photoshop: Gemini ahora te permite editar i...
-
Microsoft alerta de un troyano que desde Chrome ro...
-
Llevan meses explotando una vulnerabilidad de Chat...
-
Teclado que no utiliza letras, sino palabras compl...
-
La GPU se une a los discos duros basados en PCIe: ...
-
Un ciberataque compromete 330 GB de datos confiden...
-
NVIDIA presenta los modelos de razonamiento de IA ...
-
La mítica marca Española de calzado J´Hayber vícti...
-
La RAE confirma haber sufrido un ataque de ransomware
-
NVIDIA BlackWell RTX PRO 6000 con 96 GB de VRAM y ...
-
China construye una base submarina a 2 km de profu...
-
Los creadores de Stable Diffusion presentan una IA...
-
Utilizan una vulnerabilidad crítica en dispositivo...
-
Vulnerabilidad de suplantación en el Explorador de...
-
NVIDIA Isaac GR00T N1, la primera IA de código abi...
-
Campaña de Phishing: "Alerta de seguridad" FALSA e...
-
🔈Amazon Echo: o cedes tus datos y privacidad a la...
-
Descifrador del ransomware Akira mediante GPU
-
Google compra Wiz por 32.000 millones de dólares, ...
-
Una nueva técnica envía sonido a una persona espec...
-
GIMP 3: ya puedes descargar la nueva versión del e...
-
“Hackearon mi teléfono y mi cuenta de correo elect...
-
Generar imágenes mediante IA con Stable Diffusion
-
Steve Wozniak alerta del uso de la IA como «herram...
-
La IA de código abierto iguala a los mejores LLM p...
-
Grupo Lazarus de Corea del Norte hizo el mayor rob...
-
El FBI y CISA alertan ante el aumento de los ataqu...
-
Android 16 incluirá Battery Health
-
SteamOS para PC, la alternativa a Windows
-
Venden acceso total a red de gasolineras de México...
-
Ransomware Akira cifró los datos desde una cámara ...
-
ASUS anuncia monitores con purificador de aire inc...
-
Facebook, Instagram y Threads empiezan a probar la...
-
Texas Instruments crea el microcontrolador más peq...
-
Algunas impresoras están imprimiendo texto aleator...
-
Deep Research, la herramienta de Gemini que convie...
-
La nueva versión de Visual Studio Code te permite ...
-
Las descargas de LibreOffice se disparan con el re...
-
China anuncia una nueva tecnología que permite ver...
-
Google anuncia Gemma 3: su nueva IA ligera para di...
-
Gemini puede usar tu historial de Google para dart...
-
MySQL Replication (Master-Slave)
-
Advierten sobre Grandoreiro, troyano brasileño que...
-
Retan a ChatGPT y DeepSeek a jugar al ajedrez y lo...
-
Una actualización de HP deja inservibles a sus imp...
-
Windows App sustituirá a Escritorio Remoto
-
El gobierno de España quiere multar con hasta 35 m...
-
AMD ANTI-LAG 2: Qué es y qué novedades trae
-
Google lanza una terminal Linux nativo en Android
-
Chipset B850 vs B650 para AMD AM5
-
Crean el primer microchip para IA hecho con carbon...
-
Oleada de ciberataques en España
-
España, entre los países de la UE con más tarjetas...
-
Otra empresa China lanza un nuevo agente de IA y a...
-
Detecta una funcionalidad oculta en el chip de con...
-
La IA está facilitando los fraude de identificación
-
Los grupos de ransomware prefieren el "acceso repe...
-
Vulnerabilidad en PHP-CGI en Windows aprovechada p...
-
Tres vulnerabilidades activas en VMware
-
Extensión de VSCode contiene código malicioso
-
PowerToys permite convertir archivos multimedia
-
Microsoft desarrolla modelos de IA para competir c...
-
Redimensionar particiones con GParted
-
Cómo clonar tu SSD o disco duro con CloneZilla
-
Guía carriles (líneas) PCie
-
Una red de bots compromete más de 30.000 dispositi...
-
Radeon RX 9070 XTX en junio para competir con la G...
-
Google integra Gemini a Calendar para mejorar sus ...
-
Alarga la vida de tu viejo teléfono Android con Li...
-
Filtradas cuentas y datos bancarios de 80 mil mexi...
-
La china Alibaba lanza una IA que dice mejorar a D...
-
Generali sufre un ciberataque que afecta a los ex ...
-
Las mejores extensiones de Chrome para detectar im...
-
Precios recomendados tarjetas gráficas (GPU) de se...
-
El cofundador de Instagram predice que la IA reemp...
-
Tarjetas gráficas NVIDIA y AMD: Guía de equivalenc...
-
Chema Alonso abandona Telefónica
-
La filtración del grupo de ransomware desvela que ...
-
OnlyFans: menores venden videos explícitos aprovec...
-
Intel Core Ultra Serie 2: IA y potencia
-
Apple presenta el M3 Ultra, el nuevo chip de Apple...
-
Legálitas sufre una brecha de datos y filtra DNIs ...
-
El 99% de las organizaciones informan problemas de...
-
Apple presenta el nuevo MacBook Air con chip M4 y ...
-
Protección de Datos de España multa con 1 millón d...
-
Realme 14 Pro y 14 Pro+ llegan a España haciendo g...
-
Herramientas con interfaz web para Ollama (IA)
-
GPT-4.5 de OpenAI rompe récords en las pruebas de ...
-
Desarrollan baterías que convierten energía nuclea...
-
Amazon trabaja en una IA (Nova) de razonamiento pa...
-
LaLiga bloquea direcciones IP de CloudFlare y afec...
-
Spotify bloquea definitivamente las APK piratas: u...
-
-
▼
marzo
(Total:
110
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Google anunció que su herramienta Deep Research para Gemini ya está disponible para todos los usuarios sin coste alguno . El asistente que p...
-
DeepSeek , la compañía china especializada en inteligencia artificial, sigue expandiendo su ecosistema tecnológico con el lanzamiento de Fir...
-
Ha pasado poco más de un mes desde que se lanzó LibreOffice 25.2, la nueva versión de la suite ofimática de código abierto, y la recepción n...
Adiós, Photoshop: Gemini ahora te permite editar imágenes de forma conversacional y gratis
La semana pasada, Google le dio un buen repaso a la oferta de LLM (Grandes Modelos de Lenguaje) en Gemini. Los usuarios de cuentas gratuitas dijeron adiós a los modelos 1.5 y la bienvenida a 2.0 Flash, 2.0 Flash Thinking (experimental), las Gems de Gemini y la función Deep Research, mientras que los suscriptores de Gemini Advanced ganaron el modelo 2.0 Pro (Experimental). Entre todas estas novedades, pasó desapercibido que Gemini 2.0 Flash pasaba a contar con generación nativa de imágenes, pero con una diferencia muy importante frente a competidores como ChatGPT, que las crea mediante DALL-E: no solo genera imágenes a partir de un prompt, sino que el usuario también puede subirlas y editarlas. Como si estuviera usando Photoshop, pero mediante lenguaje natural y pidiéndole con instrucciones escritas lo que quiere en cada momento. No es una capacidad aún perfecta, pero sí funciona razonablemente bien y pone la edición de imágenes al alcance de cualquiera, sin necesidad de ningún software caro y complicado de usar.
- Gemini 2.0 Flash (Image Generation) Experimental es el primer LLM conversacional que genera imágenes de forma nativa y está disponible para todos los usuarios de cuentas de Google en Google AI Studio.
Cómo acceder al Photoshop conversacional de Gemini
Gemini 2.0 Flash (Image Generation) Experimental no está disponible en la web o la app de Gemini, sino a través de Google AI Studio. Probablemente porque Google está escarmentada de su primer intento de dotar a Gemini de capacidades generativas de imagen, que se saldó hace un año con su suspensión por ser demasiado woke.
Google AI Studio
es una plataforma de desarrollo de inteligencia artificial que permite a
los desarrolladores crear y entrenar modelos de aprendizaje automático
de manera más sencilla y eficiente, pero que cualquiera con una
cuenta de Google puede utilizar de forma gratuita y aprovechar el acceso
que da a una larga lista de modelos de lenguaje de Google. Lo único que tienes que hacer es seleccionar en el menú Model, en la columna de la izquierda, la opción Gemini 2.0 Flash (Image Generation) Experimental.
Este modelo de lenguaje saltó a los titulares por su capacidad para eliminar marcas de agua en fotografías, lo que evidentemente supone un problema para empresas como Shutterstock o Getty Images. Las sustituye por una marca SynthID, tecnología desarrollada por Google DeepMind que permite identificar imágenes generadas o modificadas mediante IA, reemplazando así la marca de agua original por una de Editado con IA. Dista de ser un método confiable, dado que también es posible eliminar marcas de IA con herramientas de IA.
Qué puedes hacer en las imágenes mediante instrucciones escritas
Pero por lo que resulta rompedor es por permitir a los usuarios editar imágenes como si estuvieran utilizando Photoshop, aunque mediante una interfaz de lenguaje natural intuitiva. Con solo pedírselo por escrito, Gemini 2.0 Flash puede agregar objetos, eliminarlos, modificar escenarios, cambiar la iluminación, ajustar los ángulos, acercar o alejar la imagen y realizar otras transformaciones, respetando la coherencia del mundo representado.
Photoshop no está al margen de la revolución IA, y Adobe ha ido añadiendo capacidades de este tipo a sus herramientas en los últimos meses. La función Relleno generativo permite manipular imágenes mediante instrucciones escritas, pero su uso no resulta tan natural como Gemini 2.0 Flash.
Los resultados no siempre ofrecen la misma calidad, pero Gemini 2.0 Flash es un modelo ligero diseñado para responder de forma rápida y consumiendo pocos recursos. No es tan potente como la versión completa, pero está dando sus primeros pasos en la generación de imágenes, y lo esperable es ver cómo mejoran sus resultados en futuras iteraciones.
Diferencia entre la generación de imágenes en Gemini 2.0 Flash y otros modelos
La diferencia entre la generación de imágenes de Gemini 2.0 Flash y otros modelos como ChatGPT es que mientras en este último se recurre a un modelo de IA independiente basado en tecnología de difusión (DALL-E en el caso de OpenAI, que utiliza un principio de síntesis diferente al de los LLM) para generar imágenes, que luego se muestran al usuario dentro de la interfaz de chat, Gemini 2.0 Flash es tanto el modelo de lenguaje grande como el generador de imágenes de IA en un solo sistema.
OpenAI avanzó el año pasado que GPT-4o también era capaz de generar imágenes de forma nativa, pero esta capacidad no se ha llevado aún al producto final.
Probablemente por el alto coste computacional y los riesgos
relacionados con la seguridad que presenta la generación de imágenes con
IA.
Otros aspectos en los que destaca la generación de imágenes de Gemini 2.0 Flash (Image Generation) Experimental son mantener la consistencia de los personajes a través de imágenes sucesivas y la representación de texto, aspectos en los que otros modelos todavía tienen serias dificultades.
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.