-
▼
2025
(Total:
470
)
-
▼
marzo
(Total:
157
)
-
Telegram supera los mil millones de usuarios
-
Cómo un exploit de la NSA se convirtió en el orige...
-
¿Qué es JPEG XL?
-
¿Qué son los shaders y por qué debes esperar antes...
-
Neurodatos: qué son y por qué son el futuro
-
¿Qué es un ASIC?
-
Calibre 8.1 mejora su compatibilidad con macOS e i...
-
Alcasec vendió datos sensibles de 130.000 policías...
-
Hackean un proveedor de SMS y lo utilizan para rob...
-
Filtración masiva de 6 millones registros de Oracl...
-
Vulnerabilidades críticas en Veeam Backup e IBM AIX
-
IngressNightmare: vulnerabilidades críticas del co...
-
El 87% de lo usuarios hace copias de seguridad, pe...
-
Vulnerabilidad crítica en Next.js
-
Hacker antigobierno hackea casi una decena de siti...
-
Google confirma que el desarrollo de Android pasar...
-
Ubuntu 25.04 beta ya disponible, con GNOME 48 y Li...
-
Anthropic asegura haber descubierto cómo ‘piensan’...
-
ChatGPT, Gemini y Claude no pueden con un test que...
-
Amazon presenta ‘Intereses’ una IA que caza oferta...
-
Microsoft rediseña el inicio de sesión para que te...
-
¿Qué significa «in the coming days»? la tendencia ...
-
Por culpa de Trump, empresas y gobiernos europeos ...
-
Signal es seguro… hasta que invitas a un periodist...
-
ChatGPT puede crear imágenes realistas gracias al ...
-
Evolución del menú de inicio de Windows en casi 3...
-
Gemini 2.5 Pro es el “modelo de IA más inteligente...
-
DeepSeek presenta un nuevo modelo de IA optimizado...
-
Samsung y Google tienen casi listas sus gafas con ...
-
⚡️ NVMe sobre TCP/IP
-
🇰🇵 Corea del Norte se prepara para la ciberguerr...
-
🇨🇳 Los creadores de Deepseek tienen prohibido ir...
-
Microsoft usará agentes autónomos de IA para comba...
-
EU OS: La nueva alternativa Linux comunitaria para...
-
China presenta un arma capaz de cortar cualquier c...
-
Historia de Apple
-
Microsoft le dice a los usuarios de Windows 10 que...
-
ReactOS el «Windows de código abierto», se actualiza
-
Denuncia a OpenAI después de que ChatGPT le acusar...
-
💾 Seagate presenta un disco duro mecánico con int...
-
🤖 Claude ya permite buscar en internet para obten...
-
Meta AI llega finalmente a Europa, integrando su c...
-
Francia rechaza la creación de puertas traseras en...
-
🤖Cómo saber si una imagen o vídeo ha sido generad...
-
OpenAI presenta dos nuevos modelos de audio para C...
-
El cofundador de Instagram revela a lo que se dedi...
-
Vigilancia masiva con sistemas de posicionamiento ...
-
Las 20 mejores herramientas de Kali Linux para 2025
-
Cómo instalar Stable Diffusion (para generar imáge...
-
La primera versión de Kali Linux de 2025
-
Marruecos: más de 31,000 tarjetas bancarias divulg...
-
Modo Dios en Android Auto
-
Google anuncia el Pixel 9a, con funciones de IA, e...
-
Europa fuerza a Apple a abrir su ecosistema y acus...
-
La App Contraseñas de Apple fue durante tres meses...
-
Adiós, Photoshop: Gemini ahora te permite editar i...
-
Microsoft alerta de un troyano que desde Chrome ro...
-
Llevan meses explotando una vulnerabilidad de Chat...
-
Teclado que no utiliza letras, sino palabras compl...
-
La GPU se une a los discos duros basados en PCIe: ...
-
Un ciberataque compromete 330 GB de datos confiden...
-
NVIDIA presenta los modelos de razonamiento de IA ...
-
La mítica marca Española de calzado J´Hayber vícti...
-
La RAE confirma haber sufrido un ataque de ransomware
-
NVIDIA BlackWell RTX PRO 6000 con 96 GB de VRAM y ...
-
China construye una base submarina a 2 km de profu...
-
Los creadores de Stable Diffusion presentan una IA...
-
Utilizan una vulnerabilidad crítica en dispositivo...
-
Vulnerabilidad de suplantación en el Explorador de...
-
NVIDIA Isaac GR00T N1, la primera IA de código abi...
-
Campaña de Phishing: "Alerta de seguridad" FALSA e...
-
🔈Amazon Echo: o cedes tus datos y privacidad a la...
-
Descifrador del ransomware Akira mediante GPU
-
Google compra Wiz por 32.000 millones de dólares, ...
-
Una nueva técnica envía sonido a una persona espec...
-
GIMP 3: ya puedes descargar la nueva versión del e...
-
“Hackearon mi teléfono y mi cuenta de correo elect...
-
Generar imágenes mediante IA con Stable Diffusion
-
Steve Wozniak alerta del uso de la IA como «herram...
-
La IA de código abierto iguala a los mejores LLM p...
-
Grupo Lazarus de Corea del Norte hizo el mayor rob...
-
El FBI y CISA alertan ante el aumento de los ataqu...
-
Android 16 incluirá Battery Health
-
SteamOS para PC, la alternativa a Windows
-
Venden acceso total a red de gasolineras de México...
-
Ransomware Akira cifró los datos desde una cámara ...
-
ASUS anuncia monitores con purificador de aire inc...
-
Facebook, Instagram y Threads empiezan a probar la...
-
Texas Instruments crea el microcontrolador más peq...
-
Algunas impresoras están imprimiendo texto aleator...
-
Deep Research, la herramienta de Gemini que convie...
-
La nueva versión de Visual Studio Code te permite ...
-
Las descargas de LibreOffice se disparan con el re...
-
China anuncia una nueva tecnología que permite ver...
-
Google anuncia Gemma 3: su nueva IA ligera para di...
-
Gemini puede usar tu historial de Google para dart...
-
MySQL Replication (Master-Slave)
-
Advierten sobre Grandoreiro, troyano brasileño que...
-
Retan a ChatGPT y DeepSeek a jugar al ajedrez y lo...
-
Una actualización de HP deja inservibles a sus imp...
-
-
▼
marzo
(Total:
157
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
- Nuevo DNI digital: cómo funciona y cuándo será posible llevar el DNI en el móvil
- Trump restó importancia a la filtración de planes militares de EEUU en un chat
- Corea del Norte prepara un ejército de hackers: especializados en IA para espiar a Occidente
- Elon Musk cobra la API de Twitter (X) a precio de oro: esta app te permite usarla gratis
- Microsoft cerrará Skype en mayo y lo reemplazará por Teams
Entradas populares
-
El joven facilitó datos de 22 guardias civiles a la banda, que realizó seguimientos, colocó balizas y tendió trampas a los agentes que les i...
-
Conectarse a un dispositivo remoto, ver lo que le ocurre y hasta controlarlo a distancia son tres de las cualidades que poseen aplicacione...
-
La Comisaría General de Información sostiene en el juzgado 50 de Madrid, que investiga los hechos, que el robo habría sido efectuado por A...
Generar imágenes mediante IA con Stable Diffusion
Stable Diffusion XL (SDXL) es el último modelo de imagen AI que puede generar personas realistas, texto legible y diversos estilos artísticos con una excelente composición de imagen. Se trata de una versión más grande y mejorada del célebre modelo Stable Diffusion v1.5, y de ahí el nombre SDXL.
Stable Diffusion XL 1.0 model
- Imágenes de mayor calidad
- Sigue más de cerca la indicación
- Más detalles
- Mayor tamaño de imagen
- Capacidad para generar texto legible
- Capacidad para producir imágenes más oscuras
Contenidos:
- Qué es el modelo SDXL.
- Mi resultado de la prueba de comparar las imágenes generadas con los modelos v1 y SDXL.
- Ejecutando SDXL 1.0 en AUTOMATIC1111 Stable Diffusion WebUI.
¿Qué es el modelo Stable Diffusion XL?
El modelo Stable Diffusion XL (SDXL) es la actualización oficial del modelo v1.5. El modelo se publica como software de código abierto.
Número de parámetros
Se trata de un modelo mucho más amplio. En el mundo de la IA, podemos esperar que sea mejor. El número total de parámetros del modelo SDXL es de
- 3.500 millones (modelo SDXL Base)
- 6.600 millones (modelo SDXL Base + refinador)
En comparación con los 0.980 millones del modelo v1.5.
Diferencias entre los modelos SDXL y v1.5
El modelo SDXL es, en la práctica, dos modelos. Se ejecuta el modelo base, seguido del modelo refinador. El modelo base establece la composición global. El modelo refinador añade detalles más precisos. (Opcionalmente, puede ejecutar sólo el modelo base).
El modelo de lenguaje (el módulo que entiende tus prompts) es una combinación del modelo más grande de OpenClip (ViT-G/14) y el ViT-L propietario de CLIP de OpenAI. Esta es una elección inteligente porque Stable Diffusion v2 utiliza OpenClip solo y es difícil de promptear. Traer de vuelta el CLIP de OpenAI hace que los avisos sean más fáciles. Los prompts que funcionan en v1.5 tendrán una buena oportunidad de funcionar en SDXL.
El modelo SDXL tiene un nuevo condicionante de tamaño de imagen que pretende utilizar imágenes de entrenamiento menores de 256×256. Esto aumenta significativamente los datos de entrenamiento al no descartar el 39% de las imágenes.
La U-Net, la parte más crucial del modelo de difusión, es ahora 3 veces mayor. Junto con el modelo de lenguaje más grande, el modelo SDXL genera imágenes de alta calidad que se ajustan perfectamente a la petición.
El tamaño de imagen por defecto de SDXL es de 1024×1024. Este tamaño es 4 veces mayor que el de 512×512 del modelo v1.5.
Imágenes de muestra de SDXL
Los usuarios prefieren abrumadoramente el modelo SDXL al modelo 1.5 (figura del artículo de investigación)
Según el propio estudio de Stability AI, la mayoría de los usuarios prefieren las imágenes del modelo SDXL al modelo base v1.5. Encontrarás una serie de imágenes generadas con las mismas indicaciones a partir de los modelos v1.5 y SDXL. Puedes decidir por ti mismo.
Descargar e instalar los modelos SDXL 1.0
Puedes encontrar los modelos SDXL base, refiner y VAE en el siguiente repositorio.
Aquí están los enlaces de descarga directa de los archivos del modelo safetensor. Por lo general, no es necesario descargar el archivo VAE a menos que planee probar diferentes.
Para instalar los modelos en AUTOMATIC1111, poner la base y los modelos de refinador en la carpeta stable-diffusion-webui > models > Stable-diffusion.
Consejos sobre el uso del modelo SDXL 1.0
El personal de A Stability AI ha compartido algunos consejos sobre el uso del modelo SDXL 1.0. He aquí el resumen.
Tamaño de la imagen
El tamaño nativo es 1024×1024. SDXL admite diferentes relaciones de aspecto, pero la calidad es sensible al tamaño. Estos son los tamaños de imagen utilizados en DreamStudio, el generador de imágenes oficial de Stability AI
- 1:1 – 1024 x 1024
- 5:4 – 1152 x 896
- 3:2 – 1216 x 832
- 16:9 – 1344 x 768
- 21:9 – 1536 x 640
Utiliza la extensión Aspect Ratio Selector para cambiar cómodamente a estos tamaños de imagen. Añada las siguientes líneas a resolutions.txt en la carpeta de la extensión (stable-diffusion-webui\extensions\sd-webui-ar).
XL1:1, 1024, 1024
XL5:4, 1152, 896
XL3:2, 1216, 832
XL16:9, 1344, 768
XL21:9, 1536, 640
Indicación negativa
Las indicaciones negativas no son tan necesarias en los modelos 1.5 y 2.0. Muchos términos negativos comunes son inútiles, por ejemplo, Dedos de más.
Ponderación de palabras clave
No es necesario utilizar una ponderación de palabras clave alta como en los modelos v1. 1,5 es muy alto para el modelo SDXL. Es posible que tengas que reducir los pesos cuando reutilices las indicaciones de los modelos v1. Reducir un peso funciona mejor que aumentarlo.
Safetensor
Utiliza siempre la versión safetensor, no la versión checkpoint. Es más segura y no ejecutará códigos en su máquina.
Intensidad del refinador
Utiliza una intensidad de refinador baja para obtener el mejor resultado.
Refinador
Utiliza una imagen con ruido para obtener el mejor resultado del refinador.
Ejecutar modelo SDXL en AUTOMATIC1111
AUTOMATIC1111 Web-UI ahora soporta los modelos SDXL de forma nativa. Ya no es necesaria la extensión SDXL demo para ejecutar el modelo SDXL.
La actualización que soporta SDXL fue liberada el 24 de Julio de 2023. Es posible que necesite actualizar su AUTOMATIC1111 para utilizar los modelos SDXL.
Uso de los modelos base + refinador
Ahora puede utilizar el modelo refinador con el modelo base en la pestaña txt2img. Necesitas la versión 1.6.0 o superior de WebUI.
Para habilitar el refinador, expande la sección Refinador:
- Punto de control: Seleccione el modelo SD XL refiner 1.0.
- Conmutar en: Este valor controla en qué paso la canalización cambia al modelo de refinador. Por ejemplo, cambiar a 0,5 y utilizar 40 pasos significa utilizar el modelo base en los primeros 20 pasos y el modelo de refinador en los 20 pasos siguientes. Si se cambia a 1, sólo se utiliza el modelo base.
Haga clic en Generar para convertir texto en imagen.
El cambio a 0,8 y 1,0 (sin utilizar el refinador) son bastante similares. 0,6 produce la imagen de mayor calidad.
¿Qué tal cambiar el número de pasos de muestreo?
Un mayor número de pasos produce imágenes de calidad ligeramente superior. Pero la diferencia es mínima por encima de 30 pasos.
En resumen, yo usaría 30 pasos y cambiaría a 0.6 para generar imágenes con base + refinador.
Usando estilos preestablecidos para SDXL
DreamStudio, el generador oficial de Stable Diffusion, tiene una lista de estilos preestablecidos disponibles. En realidad se implementan añadiendo palabras clave al prompt y al prompt negativo. Puedes instalar la extensión StyleSelectorXL para añadir la misma lista de estilos predefinidos a AUTOMATIC1111.
Instalando la extensión StyleSelectorXL
Para instalar la extensión, navegue a la página de Extensiones en AUTOMATIC1111. Seleccione la pestaña Instalar desde URL. Ponga lo siguiente en la URL para el repositorio git de la extensión.
Presione Instalar. Después de que veas la confirmación de instalación exitosa, reinicia completamente la Web-UI de AUTOMATIC1111.
Usando el selector de estilo SDXL
Deberías ver aparecer una nueva sección en la página txt2img.
Escribe el prompt y el prompt negativo como de costumbre. Asegúrate de que la opción Estilos SDXL está activada. Selecciona un estilo que no sea base para aplicar un estilo.
- Isométrico
- Fotográfico
- Anime
- Cómic
- Estilos preestablecidos SDXL.
Algunas notas sobre SDXL
Asegúrate de utilizar un tamaño de imagen de 1024 x 1024 o similar. 512×512 no funciona bien con SDXL.
Normalmente no se utiliza el modelo refinador con un modelo SDXL ajustado. El estilo puede no ser compatible.
Preguntas frecuentes
¿Puedo utilizar SDXL en Mac?
Sí, necesitará un Mac con Apple Silicon M1 o M2. Asegúrese de que su AUTOMATIC1111 está actualizado. Consulte el tutorial de instalación.
¿Puedo utilizar ControlNet con los modelos SDXL?
Actualmente ControlNet sólo funciona con modelos v1. SDXL no está soportado.
Pero parece que se está trabajando en ello.
¿Qué tamaños de imagen debo utilizar con los modelos SDXL?
A continuación se indican los tamaños de imagen recomendados para las distintas relaciones de aspecto.
- 21:9 – 1536 x 640
- 16:9 – 1344 x 768
- 3:2 – 1216 x 832
- 5:4 – 1152 x 896
- 1:1 – 1024 x 1024
Recursos de Stable Diffusion XL
- SDXL prompts: Empiece rápidamente con estas instrucciones.
- Styles for SDXL: Demostración de más de cien estilos.
- SDXL Artist browser: Investiga los estilos artísticos en Stable Diffusion XL.
Optimizar Stable Diffusion XL
Conseguiremos generar imágenes con SDXL utilizando tan solo 4 GB de memoria, por lo que será posible utilizar una tarjeta gráfica de gama baja.
Antes había que optimizar los mecanismos de atención instalando librerías como xFormers o FlashAttention.
Si te preguntas por qué en este artículo no aparece mención a estas optimizaciones, es porque ya no hacen falta. Desde la llegada de PyTorch 2.0, la optimización de estos algoritmos está integrada en la propia librería a través de varias implementaciones (como estas dos mencionadas). PyTorch utilizará la implementación adecuada según los inputs y el hardware en uso.
FP16
Por defecto Stable Diffusion XL utiliza el formato de coma flotante de 32 bits (FP32) para representar los números con los que trabaja y realiza cálculos.La pregunta obvia es... ¿se puede bajar la precisión? La respuesta es sí. Al utilizar el parámetro
torch_dtype=torch.float16
, el modelo se carga en memoria en formato de coma flotante de media precisión (FP16). Para evitar realizar esta conversión constantemente podemos descargar el modelo en formato FP16, ya que se distribuye esa variante. Basta con incluir el parámetro variant='fp16'
.Entradas relacionadas:






0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.