Blog elhacker.NET: Cómo instalar Stable Diffusion (para generar imágenes mediante IA) en Windows con AUTOMATIC1111

Stable Diffusion es una potente herramienta que te permite crear imágenes impresionantes utilizando solo texto. Con su interfaz de usuario web, podrás interactuar de manera sencilla y crear imágenes sorprendentes con solo unos pocos clics.

Herramientas para generar imágenes con inteligencia artificial, basados en Stable Diffusion

Forge

Desarrollado por Lymin Zhang, el desarrollador de Fooocus o ControlNet (extensión de Stable Diffusion que permite un mayor control sobre la imagen que generamos), Forge funciona más rápido que Automatic1111 con la misma memoria gráfica. En función de la cantidad de memoria que disponga nuestra tarjeta gráfica su rendimiento será más optimo, a menor cantidad mejor rendimiento notaremos:

6GB – mejora de un 60a un 75%
8Gb – mejora de un 30% a un 45%
24GB – mejora de un 3 a un 6%

La interfaz es muy similar a la que vemos en Automatic1111. Además de contar con extensiones instaladas por defecto como Controlnet, SVD o Z123. Otro punto a su favor es su compatibilidad con el modelo Flux1.

Descargar Forge

Fooocus

Focus es una de las herramientas más sencillas para generar imágenes a través de modelos de inteligencia artificial aunque con algunas limitaciones a la hora de tener una mayor control sobre la generación de imágenes.

Una vez que hemos introducido el prompt podremos elegir un balance entre calidad o velocidad, la resolución y el número de imágenes que generará al procesar la petición.

Además podremos establecer que estilo tendrá la imagen, cargar diferentes modelos y otros parámetros más avanzados.

Esta UI es genial para quienes quieren empezar a probar la generación de imágenes con IA testeando diferentes prompts e iterando para comprobar los resultados en función del texto que introduzcamos

ComfyUI

ComfyUI se lanzó en GitHub en enero de 2023. Requiere de algunos conocimientos técnicos para su instalación pero en poco tiempo prevén lanzar una versión de escritorio compatible con Windows y MacOS que harán mucho más fácil su instalación y la gestión de extensiones.

ComfyUI es una interfaz que ha tenido muy buena aceptación por parte de la comunidad a pesar de su aparente complejidad, ya que no trabajamos con una interfaz predeterminada.

ComfyUI lleva la flexibilidad a un nivel completamente nuevo. Vamos añadiendo nodos a su mesa de trabajo (cada uno de los cuales representa una operación o modelo diferente) según necesitemos realizar una determinada acción; como generar imágenes de alta resolución, aplicar técnicas de retoque o combinar varios modelos para obtener mejores resultados

La conexión entre los diferentes nodos crea flujos que podremos guardar para recuperar en otra ocasión o compartirlo en su comunidad con otros usuarios, lo que nos facilitará realizar determinadas tareas.

Este enfoque de programación visual facilita la creación de prototipos, la prueba y la iteración de ideas. Aquí tienes los primeros pasos para empezar a generar imágenes con esta herramienta.

Automatic1111

Automatic1111 fue la primera interfaz donde podíamos ejecutar modelos basados en Stable Difussion, fueron muchos los que empezamos a usarlo gracias a los Notebooks ejecutados en Google Collab. Actualmente sigue teniendo un buen soporte por parte de la comunidad, aunque existe cierta preferencia a Forge, ya que su rendimiento está más optimizado.

Antes de comenzar el proceso de instalación, asegúrate de que tu PC cumple con los requisitos de hardware necesarios para ejecutar Stable Diffusion de manera óptima. Asegúrate de tener lo siguiente:

Tarjeta gráfica NVIDIA con al menos 8 GB de memoria.
20 GB de almacenamiento en tu disco duro o SSD.
16 GB de memoria del sistema.

Es importante contar con una tarjeta gráfica potente para poder aprovechar al máximo las capacidades de Stable Diffusion. Recuerda que estas son solo las especificaciones mínimas, por lo que si cuentas con una tarjeta más potente, obtendrás mejores resultados.

Pros:

Interfaz de usuario fácil de usar.
Capacidad para crear imágenes impresionantes con solo texto.
Requisitos de hardware mínimos.

Contras:

Requiere una tarjeta gráfica NVIDIA.
Gran cantidad de almacenamiento necesario.

Instalación manual del software

Instalación de herramientas Git y Python

La instalación de Stable Diffusion requiere la instalación de algunos programas adicionales que no vienen por defecto en Windows. A continuación, te mostraré cómo descargar e instalar estos programas para que puedas continuar con la instalación de Stable Diffusion.

3.1 Descargar Python Para comenzar, necesitarás descargar Python, un lenguaje de programación ampliamente utilizado que es necesario para ejecutar Stable Diffusion. Asegúrate de descargar la versión recomendada e instalarla siguiendo las instrucciones en pantalla.

Para visitar la página web de Python e instalar la versión 3.10.6 de Python para una operación de Difusión Estable. Descarga el archivo “Instalador para Windows (64 bits)”. Recuerda marcar la opción “Agregar Python 3.10 al PATH” durante la instalación de Python y luego presiona Instalar Ahora para finalizar el proceso.

3.2 Descargar Git El siguiente programa que necesitarás descargar es Git, un sistema de control de versiones que te permitirá clonar el repositorio de Automatic 1111 necesario para la instalación de Stable Diffusion. Descarga la versión recomendada e instálala siguiendo las instrucciones en pantalla.

Visita la página web de Git y luego descarga “Configuración de Git para Windows de 64 bits”. E instalarlo. Solo sigue haciendo clic en siguiente para terminar toda la instalación de la herramienta. Solo necesitas prestar atención para marcar la opción “Integración con el Explorador de Windows”. Como se muestra en la imagen que te mostramos a continuación.

3.3 Descargar el Cuaderno de Herramientas de CUDA Si tu tarjeta gráfica NVIDIA no es compatible con Stable Diffusion de forma automática, es posible que debas descargar el Cuaderno de Herramientas de CUDA. Este cuaderno proporciona las bibliotecas necesarias para aprovechar al máximo tu tarjeta gráfica. Descarga el Cuaderno de Herramientas de CUDA desde el sitio web de NVIDIA e instálalo siguiendo las instrucciones proporcionadas.

Crear una carpeta para la interfaz de usuario web de Stable Diffusion e instalar

Encuentra una unidad de almacenamiento con suficiente espacio y crea una carpeta para la instalación de Stable Diffusion.

Haz clic derecho con el ratón para abrir el menú rápido y selecciona “Abrir Git Bash aquí”. Se abrirá una ventana de símbolo del sistema. Escribe la línea de comandos “git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git” y luego comenzará la instalación de la interfaz de usuario web de Stable Diffusion.

Instalación automática Windows

El webui.zip es una distribución binaria para personas que no pueden instalar python y git.

Todo está incluido - simplemente haz doble clic en run.bat para lanzar.

No hay requisitos aparte de Windows 10. Sólo NVIDIA.

Después de ejecutar una vez, debe ser posible copiar la instalación a otro equipo y lanzar allí sin conexión.

https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.0.0-pre

Haz doble clic en update.bat para actualizar web UI a la última versión, espere hasta que termine y cierre la ventana.

Haz doble clic en el run.bat para iniciar web UI, durante el primer lanzamiento se descargará una gran cantidad de archivos. Después de que todo se haya descargado e instalado correctamente, debería ver un mensaje «Running on local URL: http://127.0.0.1:7860», al abrir el enlace se le presentará la interfaz web UI.

Esta es la interfaz de usuario web de Stable Diffusion, luego podemos empezar a generar la imagen que deseamos. Te daremos una breve introducción sobre la interfaz de usuario web de Stable Diffusion y cómo usarla. En primer lugar, aplica los modelos que descargamos en el punto de control de Stable Diffusion. Luego escribe la sugerencia o descripciones sobre tu pintura. La sugerencia negativa puede ayudar a evitar que se generen obras de baja calidad. Los pasos de muestreo pueden aumentar la calidad de la pintura, pero a veces demasiado puede hacer que la pintura sea mala. Ancho y alto son la resolución de la pintura, puedes ajustarla según tus necesidades. Número de lotes puede generar más imágenes a la vez. Seed significa el ID de la imagen, si encuentras el estilo de imagen que te gusta y quieres mantenerlo, haz clic en el dado para guardarlo. Luego puedes generar imágenes dentro de los estilos.

Flujo de trabajo básico para Automatic1111

Estos son los pasos esenciales para comenzar a generar imágenes:

Elige el modelo Stable Diffusion. Para empezar usa uno base como v1.5.
Escribe una descripción detallada de la imagen que quieres crear. Sé específico.
Establece el tamaño en píxeles del resultado, como 512×512 px.
Indica la cantidad de imágenes a generar cada vez. Mínimo unas pocas.
Haz clic en el botón Generar. En pocos segundos tendrás tus imágenes de IA.

Entendiendo los parámetros básicos de Automatic1111

A continuación explico con más detalle las diversas opciones de configuración disponibles:

Modelo: Elige el modelo que quieras utilizar. Cada modelo tiene una especialización distinta, hay modelos muy concretos para obtener resultados muy precisos por ejemplo de paisajes, o de personas, y también hay modelos más generalistas como SDXL.
Sampling method, o método de muestreo se refiere a la forma en que se seleccionan los píxeles de la imagen original para crear la imagen escalada. Cada método de muestreo puede darte resultados muy distintos, por lo que debes conocerlos y elegir aquel que genere las imágenes que más se adapten a tus gustos.
Sampling steps se refieren a la cantidad de veces que se aplica el método de muestreo para crear la imagen escalada. Normalmente, a más pasos, más calidad y detalle, pero a partir de 50 los resultados no serán tan buenos. Lo ideal es entre 30 y 50.
Hires fix: Emplea upscalers basados en IA para aumentar la resolución nativa de 512px a dimensiones mayores.
Refiner: nos permite aplicar otro modelo para refinar ciertos aspectos de la imagen.
Width-Height: se refiere a las dimensiones de la imagen a generar. Es importante que tengamos en cuenta las dimensiones que utiliza cada modelo. Por ejemplo, SDXL es bueno para 1024×1024, y Stable Diffusion 1.5 es bueno para 512×512.
CFG Scale: Es una escala en la que indicamos cuánto de fiel queremos que sea la generación al prompt. Cuanto más bajo sea el número, más libertad le damos. Cuanto más alto, más estricto será. Te recomendamos trabajar entre el 5 y el 8.
Batch count: Se refiere al número de lotes de imágenes que queremos generar.
Batch size: se refiere al número de imágenes que queremos generar por cada lote. Si el batch count es 2, y el batch size es 4, generaremos 2×4 imágenes = 8.
Semilla: Permite fijar el contenido variando este número. Resulta muy útil una vez que obtienes una composición que te gusta, para después ajustar el prompt conservando los elementos principales.
Semilla extra: Sirve para mezclar dos semillas distintas e interpolar sus resultados. Así puedes crear variaciones a partir de imágenes existentes.

Consejos para mejores resultados

Algunas recomendaciones para crear mejores imágenes con tus prompts:

Sé lo más descriptivo posible. Cuanto más detalles, mejor.
Utiliza adjetivos para colores, expresiones, poses, etc. Ej: «mujer pelirroja sonriendo».
Prueba prompts similares varias veces. La IA no siempre acierta a la primera.
Aumenta el tamaño de salida para más calidad. Por ejemplo 1024×1024 px.
Juega con los ajustes avanzados para generar más variaciones.

Principales funciones

Algunas de las funciones más útiles en la pestaña img2img:

Boceto: Dibuja sobre un lienzo en blanco o negro para luego generar la imagen final por IA.
Relleno: Regenera zonas marcadas con el pincel, dejando el resto intacto.
Subir imagen: Usa máscaras externas para seleccionar las áreas a rellenar.
Lote: Procesa múltiples imágenes a la vez aplicando la misma configuración.
Upscaling: Aumenta la resolución de imágenes con escaladores de IA.

Ajustes y personalización

En la pestaña Ajustes puedes configurar opciones para personalizar AUTOMATIC1111:

Modelos de restauración facial para mejorar retratos.
VAEs para optimizar ojos y rostros en modelos v1.
Accesos rápidos personalizados para activar funciones recurrentes.

Pestaña Imagen a Imagen

En la pestaña img2img puedes modificar imágenes existentes y crear otras nuevas tomándolas como base.

Inicializar Stable Diffusion

Ve a la carpeta stable-diffusion-webui, luego haz clic derecho en el archivo webui-user.bat para abrir el menú rápido. Haz clic en Editar y escribe “--xformers” después de “set COMMANDLINE_ARGS= “ y guarda los cambios. Después de eso, ejecuta webui-user.bat. El programa comenzará a descargar los componentes para Stable Diffusion y tomará algunos minutos en ejecutarse. Cuando el proceso termine, debería abrir automáticamente la página web de Stable Diffusion. Si no lo hace, puedes abrir Chrome o Edge y luego escribir 127.0.0.1:7860 para acceder a la página web.

Configuraciones extra a través de COMMANDLINE_ARGS

Hay algunas opciones de configuración que puede que desees aplicar a la interfaz de usuario web, con el fin de configurar estas opciones es necesario editar el script de lanzamiento que se encuentra en sd.webui\webui\webui-user.bat, editar el archivo de añadir los argumentos seleccionados después de set COMMANDLINE_ARGS= así :

set COMMANDLINE_ARGS=--autolaunch --update-check

Cada argumento individual debe estar separado por un espacio, el ejemplo anterior configura bien la interfaz de usuario web para lanzar automáticamente la página del navegador después de que se complete la carga, y también comprueba si hay una nueva versión de la interfaz de usuario web en el lanzamiento.

Opciones extra

Existen varios métodos de optimización de atención cruzada, como -

-xformers o --opt-sdp-attention

que pueden aumentar drásticamente el rendimiento. Consulta Optimizaciones para obtener más detalles. Experimenta con diferentes opciones, ya que cada hardware es adecuado para diferentes optimizaciones. Si deseas medir el rendimiento de su sistema, pruebe a utilizar la extensión sd-extension-system-info, que incluye una herramienta de evaluación comparativa y una base de datos con los resultados enviados por los usuarios.

add --autolaunch para que web UI inicie el navegador web automáticamente después de que web UI se haya iniciado.
add --update-check le notificará cuando haya una nueva versión de webui.

Vea Argumentos de la línea de comandos y configuración para más opciones de configuración.

Funcionamiento con la CPU

Ejecutar sólo con la CPU es posible, pero no recomendable. Es muy lento y no hay implementación fp16.

Para ejecutar, debe tener todas estas banderas habilitadas:

--use-cpu all --precision full --no-half --skip-torch-cuda-test

Aunque esta es una forma cuestionable de ejecutar webui, debido a las lentísimas velocidades de generación; usar los diversos upscalers de AI y las herramientas de subtitulado puede ser útil para algunas personas.

Uso óptimo de SDXL

Aquí tienes una lista rápida de cosas a ajustar para tu configuración:

Argumentos de línea de comandos:

Nvidia (12gb+) --xformers
Nvidia (8gb) --medvram-sdxl --xformers
Nvidia (4gb) --lowvram --xformers

Utiliza un SSD para un tiempo de carga más rápido, especialmente si se requiere un archivo de página.

Tener al menos 24gb de ram en Windows 11, y al menos 16gb en Windows 10.

Cambiar la ubicación de la carpeta de modelos

A veces puede ser útil para mover sus modelos a otra ubicación. Las razones para esto podrían ser:

El disco principal tiene poco espacio
Está utilizando modelos en múltiples herramientas y no quiere almacenarlos dos veces
La carpeta de modelos por defecto es stable-diffusion-webui/models

Descargar modelos y colocarlos en Stable Diffusion.

Después de instalar Stable Diffusion, necesitamos descargar los modelos para inicializar la aplicación. Hay muchas comunidades de modelos de inteligencia artificial en internet, por lo que podemos encontrar modelos gratuitos para usar. En general, la inteligencia artificial basada en GC utiliza modelos para generar el resultado. Puedes visitar CIVITAI y Hugging Face para encontrar los modelos que deseas utilizar.

Descarga fichero *.safetensors y colocar en la carpeta "models"

A continuación, tenemos que poner el modelo de descarga a la ruta “\Your Folder\stable-diffusion-webui\models\Stable-diffusion”

Diferentes Modelos Disponibles

Existen varias versiones de Stable Diffusion, cada una con un modelo de IA diferente para generar imágenes. Todas funcionan de la misma manera pero dan resultados diferentes y cada una tiene sus particularidades.

Las versiones recientes, SDXL y SDXL Turbo, son las más populares. La primera es la versión principal, diseñada para generar imágenes de alta calidad a 1024x1024 píxeles. La segunda es una versión optimizada para la velocidad que puede generar una imagen en una fracción de segundo.

La versión anterior 1.5 sigue siendo muy popular entre la comunidad de Stable Diffusion - principalmente debido a la gran variedad y calidad de modelos alternativos y LoRAs disponibles para esta versión.

Fuentes:

https://www.deividart.com/blog/crear-imagenes-con-inteligencia-artificial/

Blog elhacker.NET

jueves, 20 de marzo de 2025

Cómo instalar Stable Diffusion (para generar imágenes mediante IA) en Windows con AUTOMATIC1111