Tutoriales y Manuales
Entradas Mensuales
-
▼
2025
(Total:
364
)
-
▼
marzo
(Total:
87
)
-
Campaña de Phishing: "Alerta de seguridad" FALSA e...
-
🔈Amazon Echo: o cedes tus datos y privacidad a la...
-
Descifrador del ransomware Akira mediante GPU
-
Google compra Wiz por 32.000 millones de dólares, ...
-
Una nueva técnica envía sonido a una persona espec...
-
GIMP 3: ya puedes descargar la nueva versión del e...
-
“Hackearon mi teléfono y mi cuenta de correo elect...
-
Generar imágnes mediante IA con Stable Diffusion
-
Steve Wozniak alerta del uso de la IA como «herram...
-
La IA de código abierto iguala a los mejores LLM p...
-
Grupo Lazarus de Corea del Norte hizo el mayor rob...
-
El FBI y CISA alertan ante el aumento de los ataqu...
-
Android 16 incluirá Battery Health
-
SteamOS para PC, la alternativa a Windows
-
Venden acceso total a red de gasolineras de México...
-
Ransomware Akira cifró los datos desde una cámara ...
-
ASUS anuncia monitores con purificador de aire inc...
-
Facebook, Instagram y Threads empiezan a probar la...
-
Texas Instruments crea el microcontrolador más peq...
-
Algunas impresoras están imprimiendo texto aleator...
-
Deep Research, la herramienta de Gemini que convie...
-
La nueva versión de Visual Studio Code te permite ...
-
Las descargas de LibreOffice se disparan con el re...
-
China anuncia una nueva tecnología que permite ver...
-
Google anuncia Gemma 3: su nueva IA ligera para di...
-
Gemini puede usar tu historial de Google para dart...
-
MySQL Replication (Master-Slave)
-
Advierten sobre Grandoreiro, troyano brasileño que...
-
Retan a ChatGPT y DeepSeek a jugar al ajedrez y lo...
-
Una actualización de HP deja inservibles a sus imp...
-
Windows App sustituirá a Escritorio Remoto
-
El gobierno de España quiere multar con hasta 35 m...
-
AMD ANTI-LAG 2: Qué es y qué novedades trae
-
Google lanza una terminal Linux nativo en Android
-
Chipset B850 vs B650 para AMD AM5
-
Crean el primer microchip para IA hecho con carbon...
-
Oleada de ciberataques en España
-
España, entre los países de la UE con más tarjetas...
-
Otra empresa China lanza un nuevo agente de IA y a...
-
Detecta una funcionalidad oculta en el chip de con...
-
La IA está facilitando los fraude de identificación
-
Los grupos de ransomware prefieren el "acceso repe...
-
Vulnerabilidad en PHP-CGI en Windows aprovechada p...
-
Tres vulnerabilidades activas en VMware
-
Extensión de VSCode contiene código malicioso
-
PowerToys permite convertir archivos multimedia
-
Microsoft desarrolla modelos de IA para competir c...
-
Redimensionar particiones con GParted
-
Cómo clonar tu SSD o disco duro con CloneZilla
-
Guía carriles (líneas) PCie
-
Una red de bots compromete más de 30.000 dispositi...
-
Radeon RX 9070 XTX en junio para competir con la G...
-
Google integra Gemini a Calendar para mejorar sus ...
-
Alarga la vida de tu viejo teléfono Android con Li...
-
Filtradas cuentas y datos bancarios de 80 mil mexi...
-
La china Alibaba lanza una IA que dice mejorar a D...
-
Generali sufre un ciberataque que afecta a los ex ...
-
Las mejores extensiones de Chrome para detectar im...
-
Precios recomendados tarjetas gráficas (GPU) de se...
-
El cofundador de Instagram predice que la IA reemp...
-
Tarjetas gráficas NVIDIA y AMD: Guía de equivalenc...
-
Chema Alonso abandona Telefónica
-
La filtración del grupo de ransomware desvela que ...
-
OnlyFans: menores venden videos explícitos aprovec...
-
Intel Core Ultra Serie 2: IA y potencia
-
Apple presenta el M3 Ultra, el nuevo chip de Apple...
-
Legálitas sufre una brecha de datos y filtra DNIs ...
-
El 99% de las organizaciones informan problemas de...
-
Apple presenta el nuevo MacBook Air con chip M4 y ...
-
Protección de Datos de España multa con 1 millón d...
-
Realme 14 Pro y 14 Pro+ llegan a España haciendo g...
-
Herramientas con interfaz web para Ollama (IA)
-
GPT-4.5 de OpenAI rompe récords en las pruebas de ...
-
Desarrollan baterías que convierten energía nuclea...
-
Amazon trabaja en una IA (Nova) de razonamiento pa...
-
LaLiga bloquea direcciones IP de CloudFlare y afec...
-
Spotify bloquea definitivamente las APK piratas: u...
-
Nothing desvela la nueva serie Phone (3a), con cám...
-
Filtrados 570 GB de datos sensibles de CCOO
-
Procesadores que no deberías comprar en 2025
-
360XSS: inyección masiva de anuncios a través de p...
-
Google Translate mejorará sus traducciones con IA
-
Caso Interfactura, el posible hackeo que pone en j...
-
APIs y contraseñas confidenciales utilizadas para ...
-
¿Qué es DeepSeek y cómo dar tus primeros pasos con...
-
DeepSeek lanza un sistema de archivos de código ab...
-
El Corte Inglés sufre un ciberataque que ha filtra...
-
-
▼
marzo
(Total:
87
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Google anunció que su herramienta Deep Research para Gemini ya está disponible para todos los usuarios sin coste alguno . El asistente que p...
-
Las actualizaciones de Windows a veces nos dejan con algunos problemas no deseados . Y esta vez le toca tanto a Windows 10 como a Windows 11...
-
DeepSeek , la compañía china especializada en inteligencia artificial, sigue expandiendo su ecosistema tecnológico con el lanzamiento de Fir...
Generar imágnes mediante IA con Stable Diffusion
Stable Diffusion XL (SDXL) es el último modelo de imagen AI que puede generar personas realistas, texto legible y diversos estilos artísticos con una excelente composición de imagen. Se trata de una versión más grande y mejorada del célebre modelo Stable Diffusion v1.5, y de ahí el nombre SDXL.
Stable Diffusion XL 1.0 model
- Imágenes de mayor calidad
- Sigue más de cerca la indicación
- Más detalles
- Mayor tamaño de imagen
- Capacidad para generar texto legible
- Capacidad para producir imágenes más oscuras
Contenidos:
- Qué es el modelo SDXL.
- Mi resultado de la prueba de comparar las imágenes generadas con los modelos v1 y SDXL.
- Ejecutando SDXL 1.0 en AUTOMATIC1111 Stable Diffusion WebUI.
¿Qué es el modelo Stable Diffusion XL?
El modelo Stable Diffusion XL (SDXL) es la actualización oficial del modelo v1.5. El modelo se publica como software de código abierto.
Número de parámetros
Se trata de un modelo mucho más amplio. En el mundo de la IA, podemos esperar que sea mejor. El número total de parámetros del modelo SDXL es de
- 3.500 millones (modelo SDXL Base)
- 6.600 millones (modelo SDXL Base + refinador)
En comparación con los 0.980 millones del modelo v1.5.
Diferencias entre los modelos SDXL y v1.5
El modelo SDXL es, en la práctica, dos modelos. Se ejecuta el modelo base, seguido del modelo refinador. El modelo base establece la composición global. El modelo refinador añade detalles más precisos. (Opcionalmente, puede ejecutar sólo el modelo base).
El modelo de lenguaje (el módulo que entiende tus prompts) es una combinación del modelo más grande de OpenClip (ViT-G/14) y el ViT-L propietario de CLIP de OpenAI. Esta es una elección inteligente porque Stable Diffusion v2 utiliza OpenClip solo y es difícil de promptear. Traer de vuelta el CLIP de OpenAI hace que los avisos sean más fáciles. Los prompts que funcionan en v1.5 tendrán una buena oportunidad de funcionar en SDXL.
El modelo SDXL tiene un nuevo condicionante de tamaño de imagen que pretende utilizar imágenes de entrenamiento menores de 256×256. Esto aumenta significativamente los datos de entrenamiento al no descartar el 39% de las imágenes.
La U-Net, la parte más crucial del modelo de difusión, es ahora 3 veces mayor. Junto con el modelo de lenguaje más grande, el modelo SDXL genera imágenes de alta calidad que se ajustan perfectamente a la petición.
El tamaño de imagen por defecto de SDXL es de 1024×1024. Este tamaño es 4 veces mayor que el de 512×512 del modelo v1.5.
Imágenes de muestra de SDXL
Los usuarios prefieren abrumadoramente el modelo SDXL al modelo 1.5 (figura del artículo de investigación)
Según el propio estudio de Stability AI, la mayoría de los usuarios prefieren las imágenes del modelo SDXL al modelo base v1.5. Encontrarás una serie de imágenes generadas con las mismas indicaciones a partir de los modelos v1.5 y SDXL. Puedes decidir por ti mismo.
Descargar e instalar los modelos SDXL 1.0
Puedes encontrar los modelos SDXL base, refiner y VAE en el siguiente repositorio.
Aquí están los enlaces de descarga directa de los archivos del modelo safetensor. Por lo general, no es necesario descargar el archivo VAE a menos que planee probar diferentes.
Para instalar los modelos en AUTOMATIC1111, poner la base y los modelos de refinador en la carpeta stable-diffusion-webui > models > Stable-diffusion.
Consejos sobre el uso del modelo SDXL 1.0
El personal de A Stability AI ha compartido algunos consejos sobre el uso del modelo SDXL 1.0. He aquí el resumen.
Tamaño de la imagen
El tamaño nativo es 1024×1024. SDXL admite diferentes relaciones de aspecto, pero la calidad es sensible al tamaño. Estos son los tamaños de imagen utilizados en DreamStudio, el generador de imágenes oficial de Stability AI
- 1:1 – 1024 x 1024
- 5:4 – 1152 x 896
- 3:2 – 1216 x 832
- 16:9 – 1344 x 768
- 21:9 – 1536 x 640
Utiliza la extensión Aspect Ratio Selector para cambiar cómodamente a estos tamaños de imagen. Añada las siguientes líneas a resolutions.txt en la carpeta de la extensión (stable-diffusion-webui\extensions\sd-webui-ar).
XL1:1, 1024, 1024
XL5:4, 1152, 896
XL3:2, 1216, 832
XL16:9, 1344, 768
XL21:9, 1536, 640
Indicación negativa
Las indicaciones negativas no son tan necesarias en los modelos 1.5 y 2.0. Muchos términos negativos comunes son inútiles, por ejemplo, Dedos de más.
Ponderación de palabras clave
No es necesario utilizar una ponderación de palabras clave alta como en los modelos v1. 1,5 es muy alto para el modelo SDXL. Es posible que tengas que reducir los pesos cuando reutilices las indicaciones de los modelos v1. Reducir un peso funciona mejor que aumentarlo.
Safetensor
Utiliza siempre la versión safetensor, no la versión checkpoint. Es más segura y no ejecutará códigos en su máquina.
Intensidad del refinador
Utiliza una intensidad de refinador baja para obtener el mejor resultado.
Refinador
Utiliza una imagen con ruido para obtener el mejor resultado del refinador.
Ejecutar modelo SDXL en AUTOMATIC1111
AUTOMATIC1111 Web-UI ahora soporta los modelos SDXL de forma nativa. Ya no es necesaria la extensión SDXL demo para ejecutar el modelo SDXL.
La actualización que soporta SDXL fue liberada el 24 de Julio de 2023. Es posible que necesite actualizar su AUTOMATIC1111 para utilizar los modelos SDXL.
Uso de los modelos base + refinador
Ahora puede utilizar el modelo refinador con el modelo base en la pestaña txt2img. Necesitas la versión 1.6.0 o superior de WebUI.
Para habilitar el refinador, expande la sección Refinador:
- Punto de control: Seleccione el modelo SD XL refiner 1.0.
- Conmutar en: Este valor controla en qué paso la canalización cambia al modelo de refinador. Por ejemplo, cambiar a 0,5 y utilizar 40 pasos significa utilizar el modelo base en los primeros 20 pasos y el modelo de refinador en los 20 pasos siguientes. Si se cambia a 1, sólo se utiliza el modelo base.
Haga clic en Generar para convertir texto en imagen.
El cambio a 0,8 y 1,0 (sin utilizar el refinador) son bastante similares. 0,6 produce la imagen de mayor calidad.
¿Qué tal cambiar el número de pasos de muestreo?
Un mayor número de pasos produce imágenes de calidad ligeramente superior. Pero la diferencia es mínima por encima de 30 pasos.
En resumen, yo usaría 30 pasos y cambiaría a 0.6 para generar imágenes con base + refinador.
Usando estilos preestablecidos para SDXL
DreamStudio, el generador oficial de Stable Diffusion, tiene una lista de estilos preestablecidos disponibles. En realidad se implementan añadiendo palabras clave al prompt y al prompt negativo. Puedes instalar la extensión StyleSelectorXL para añadir la misma lista de estilos predefinidos a AUTOMATIC1111.
Instalando la extensión StyleSelectorXL
Para instalar la extensión, navegue a la página de Extensiones en AUTOMATIC1111. Seleccione la pestaña Instalar desde URL. Ponga lo siguiente en la URL para el repositorio git de la extensión.
Presione Instalar. Después de que veas la confirmación de instalación exitosa, reinicia completamente la Web-UI de AUTOMATIC1111.
Usando el selector de estilo SDXL
Deberías ver aparecer una nueva sección en la página txt2img.
Escribe el prompt y el prompt negativo como de costumbre. Asegúrate de que la opción Estilos SDXL está activada. Selecciona un estilo que no sea base para aplicar un estilo.
- Isométrico
- Fotográfico
- Anime
- Cómic
- Estilos preestablecidos SDXL.
Algunas notas sobre SDXL
Asegúrate de utilizar un tamaño de imagen de 1024 x 1024 o similar. 512×512 no funciona bien con SDXL.
Normalmente no se utiliza el modelo refinador con un modelo SDXL ajustado. El estilo puede no ser compatible.
Preguntas frecuentes
¿Puedo utilizar SDXL en Mac?
Sí, necesitará un Mac con Apple Silicon M1 o M2. Asegúrese de que su AUTOMATIC1111 está actualizado. Consulte el tutorial de instalación.
¿Puedo utilizar ControlNet con los modelos SDXL?
Actualmente ControlNet sólo funciona con modelos v1. SDXL no está soportado.
Pero parece que se está trabajando en ello.
¿Qué tamaños de imagen debo utilizar con los modelos SDXL?
A continuación se indican los tamaños de imagen recomendados para las distintas relaciones de aspecto.
- 21:9 – 1536 x 640
- 16:9 – 1344 x 768
- 3:2 – 1216 x 832
- 5:4 – 1152 x 896
- 1:1 – 1024 x 1024
Recursos de Stable Diffusion XL
- SDXL prompts: Empiece rápidamente con estas instrucciones.
- Styles for SDXL: Demostración de más de cien estilos.
- SDXL Artist browser: Investiga los estilos artísticos en Stable Diffusion XL.
Fuentes:
https://stable-diffusion-art.com/sdxl-model/
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.