Descarga Dreambooth Stable Diffusion - código fuente Dreambooth Stable Diffusion Descargar el código fuente de difusión

Dreambooth Stable Diffusion

Otro código fuente

1.0.0

Descargar

Dreambooth extendido guías de cómo hacer y aushan

Por correr en vasto.
Para correr en Google Colab
Para ejecutar una PC local (Windows)
Para ejecutar una PC local (Ubuntu)
Adaptando el tutorial Dreambooth de Corridor Digital al repositorio de Joepenna
Usar subtítulos en Dreambooth de Joepenna

Índice

Notas de Joe Penna
Configuración
- Instrucciones fáciles de Runpod
- Vast.ai Configuración
- Ejecutar localmente
  - venado
  - Condición
- Referencia de archivo de configuración y línea de comandos
Subtítulos y soporte de múltiples materias/conceptos
Inversión textual vs. Dreambooth
Usando el modelo generado
Depuración de sus resultados
- ¡No se parecen a ti en absoluto!
- Se parecen a ti, pero exactamente como tus imágenes de entrenamiento
- Se parecen a ti, pero no cuando intentas diferentes estilos
Abrazando los difusores de la cara

El repositorio anteriormente conocido como "Dreambooth"

imagen

Notas de Joe Penna

Introducciones!

¡Hola! Mi nombre es Joe Penna.

Es posible que hayas visto algunos videos de YouTube mía bajo Mysteryguitarman . Ahora soy director de largometrajes. Es posible que haya visto el Ártico o Stowaway.

Para mis películas, necesito poder capacitar a actores específicos, accesorios, ubicaciones, etc. Entonces, hice un montón de cambios en el repositorio de @Xavierxiao para entrenar las caras de las personas.

No puedo lanzar todas las pruebas para la película en la que estoy trabajando, pero cuando pruebo con mi propia cara, las publico en mi página de Twitter: @myteryguitarm.

Muchas de estas pruebas se realizaron con un amigo mío: Niko de Corridordigital. ¡Puede ser cómo encontraste este repositorio!

Realmente no soy un codificador. Soy terco y no tengo miedo de buscar en Google. Entonces, eventualmente, algunas personas realmente inteligentes se unieron y han estado contribuyendo. En este repositorio, específicamente: @djbielejeski @gammagec @mrsaad –– ¡pero muchos otros en nuestra discordia!

Este ya no es mi repositorio. ¡Este es el repositorio de las personas que who-wanna-see-dreambooth-on-sd-working-well!

Ahora, si quieres intentar hacer esto ... Lea las advertencias a continuación primero:

¡ADVERTENCIA!

Respetemos el arduo trabajo y la creatividad de las personas que han pasado años perfeccionando sus habilidades.
- Esta iteración de Dreambooth fue diseñada específicamente para que los artistas digitales entrenen a sus propios personajes y estilos en un modelo de difusión estable, así como para que las personas entrenen sus propias semejanzas. Mi objetivo principal es hacer una herramienta para que los cineastas interactúen con artistas conceptuales que han contratado, generar la semilla de una idea inicial, para que luego puedan comunicarse visualmente. Destinado a ser utilizado por cineastas, artistas conceptuales, diseñadores de cómics, etc.
- Un día, habrá una difusión estable entrenada en conjuntos de datos perfectos. Mientras tanto, por razones morales / éticas / potencialmente legales, desalto la capacitación del arte de otra persona en este modelo (a menos que haya obtenido un permiso explícito, o hayan hecho una declaración pública sobre esta tecnología). Por razones similares, recomiendo no usar los nombres de los artistas en sus indicaciones. ¡No ponga a las personas que hicieron esto fuera del trabajo!
En el lado técnico:
- Ahora puede ejecutar esto en una GPU con 24 GB de VRAM (por ejemplo, 3090). La capacitación será más lenta y deberá asegurarse de que este sea el único programa que se ejecuta.
- Si, como yo, no posee uno de esos, incluyo un cuaderno de Jupyter aquí para ayudarlo a ejecutarlo en una plataforma de computación en la nube alquilada.
- Actualmente se adapta a RunPod.io y Vast.ai
- También apoyamos un cuaderno Colab:
Esta implementación no implementa completamente las ideas de Google sobre cómo preservar el espacio latente.
- La mayoría de las imágenes que son similares a lo que estás entrenando se cambiarán hacia eso.
- Por ejemplo, si estás entrenando a una persona, todas las personas se verán como tú. Si estás entrenando un objeto, cualquier cosa en esa clase se parecerá a tu objeto.
No parece haber una manera fácil de entrenar a dos sujetos consecutivamente. Terminará con un archivo 11-12GB antes de podar.
- El cuaderno proporcionado tiene una podadora que lo abarca a ~2gb
La mejor práctica es cambiar el token a un nombre de celebridades ( nota: token, no clase , por lo que su mensaje sería algo así como: Chris Evans person ). Aquí está mi esposa entrenada con exactamente el mismo entorno, excepto por el token

Configuración

Instrucciones fáciles de Runpod

Nota Runpod actualiza periódicamente su imagen base Docker que puede llevar a que el repositorio no funcione. Ninguno de los videos de YouTube está actualizado, pero aún puede seguirlos como guía. Siga los típicos videos/tutoriales de YouTube de Runpod, con los siguientes cambios:

Desde dentro de la página de mis vainas,

Haga clic en el botón Menú (a la izquierda del botón Purple Play)
Haga clic en Editar Pod
Actualizar "Nombre de imagen Docker" a uno de los siguientes (probado 2023/06/27):
- runpod/pytorch:3.10-2.0.1-120-devel
- runpod/pytorch:3.10-2.0.1-118-runtime
- runpod/pytorch:3.10-2.0.0-117
- runpod/pytorch:3.10-1.13.1-116
Haga clic en Guardar.
Reinicia tu vaina

Continúa con el resto de la guía:

Regístrese en Runpod. Siéntase libre de usar mi enlace de referencia aquí, para que no tenga que pagarlo (pero usted lo hace).
Después de iniciar sesión, seleccione SECURE CLOUD o COMMUNITY CLOUD
Asegúrese de encontrar una velocidad de interento "alta" para que no esté perdiendo el tiempo y el dinero en descargas lentas
Seleccione algo con al menos 24 GB de VRAM como RTX 3090, RTX 4090 o RTX A5000
Siga estas instrucciones de video a continuación:

Vast.Ai Instrucciones

Regístrese en Vast.ai (enlaces de referencia de David Bielejeski)
Agregue algunos fondos (generalmente los agrego en incrementos de $ 10)
Navegue al cliente - Crear página
- Seleccione Pytorch/Pytorch como su imagen Docker, y los botones "Use la interfaz Jupyter Lab" y "Jupyter Direct https"
Deberá aumentar su espacio de disco y filtrar en la RAM GPU (archivos de punto de control de 2GB + archivo de modelo de 2-8GB + imágenes de regularización + otras cosas se suman rápidamente)
- Por lo general, asigno 150GB
- También es bueno verificar la velocidad de carga/descarga para suficiente ancho de banda para que no gaste todo su dinero esperando que las cosas se descarguen.
Seleccione la instancia que desee y haga clic Rent , luego diríjase a su página de instancias y haga clic Open
- Obtendrá una advertencia de certificado inseguro. Haga clic más allá de la advertencia o instale el Vast Cert.
Haga clic Notebook -> Python 3 (puede hacer este siguiente paso de varias maneras, pero normalmente hago esto)
Repo de Clone Joe con este comando
- !git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion.git
- Haga clic run
Navegue hacia el nuevo directorio Dreambooth-Stable-Diffusion a la izquierda y abra el archivo dreambooth_simple_joepenna.ipynb o dreambooth_runpod_joepenna.ipynb
Siga las instrucciones en el libro de trabajo y comience a capacitar

Ejecución de instrucciones locales

Configuración - Entorno virtual

Requisitos previos

Git
Python 3.10
cmd abierto
Clonar el repositorio
1. C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
Navegar por el repositorio
1. C:>cd Dreambooth-Stable-Diffusion

Instalar dependencias y activar entorno

cmd > python -m venv dreambooth_joepenna
cmd > dreambooth_joepennaScriptsactivate.bat
cmd > pip install torch == 1.13.1+cu117 torchvision == 0.14.1+cu117 --extra-index-url https://download.pytorch.org/whl/cu117
cmd > pip install -r requirements.txt

Correr

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

Limpieza

cmd > deactivate

Configuración - Conda

Requisitos previos

Git
Python 3.10
miniconda3
Abra Anaconda Prompt (miniconda3)
Clonar el repositorio
1. (base) C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
Navegar por el repositorio
1. (base) C:>cd Dreambooth-Stable-Diffusion

Instalar dependencias y activar entorno

(base) C:Dreambooth-Stable-Diffusion > conda env create -f environment.yaml
(base) C:Dreambooth-Stable-Diffusion > conda activate dreambooth_joepenna

Correr

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

Limpieza

cmd > conda deactivate

Referencia de archivo de configuración y línea de comandos

Archivo de configuración de ejemplo

 {
    "class_word": "woman",
    "config_date_time": "2023-04-08T16-54-00",
    "debug": false,
    "flip_percent": 0.0,
    "gpu": 0,
    "learning_rate": 1e-06,
    "max_training_steps": 3500,
    "model_path": "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt",
    "model_repo_id": "",
    "project_config_filename": "my-config.json",
    "project_name": "<token> project",
    "regularization_images_folder_path": "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim",
    "save_every_x_steps": 250,
    "schema": 1,
    "seed": 23,
    "token": "<token>",
    "token_only": false,
    "training_images": [
        "001@a photo of <token> looking down.png",
        "002-DUPLICATE@a close photo of <token> smiling wearing a black sweatshirt.png",
        "002@a photo of <token> wearing a black sweatshirt sitting on a blue couch.png",
        "003@a photo of <token> smiling wearing a red flannel shirt with a door in the background.png",
        "004@a photo of <token> wearing a purple sweater dress standing with her arms crossed in front of a piano.png",
        "005@a close photo of <token> with her hand on her chin.png",
        "005@a photo of <token> with her hand on her chin wearing a dark green coat and a red turtleneck.png",
        "006@a close photo of <token>.png",
        "007@a close photo of <token>.png",
        "008@a photo of <token> wearing a purple turtleneck and earings.png",
        "009@a close photo of <token> wearing a red flannel shirt with her hand on her head.png",
        "011@a close photo of <token> wearing a black shirt.png",
        "012@a close photo of <token> smirking wearing a gray hooded sweatshirt.png",
        "013@a photo of <token> standing in front of a desk.png",
        "014@a close photo of <token> standing in a kitchen.png",
        "015@a photo of <token> wearing a pink sweater with her hand on her forehead sitting on a couch with leaves in the background.png",
        "016@a photo of <token> wearing a black shirt standing in front of a door.png",
        "017@a photo of <token> smiling wearing a black v-neck sweater sitting on a couch in front of a lamp.png",
        "019@a photo of <token> wearing a blue v-neck shirt in front of a door.png",
        "020@a photo of <token> looking down with her hand on her face wearing a black sweater.png",
        "021@a close photo of <token> pursing her lips wearing a pink hooded sweatshirt.png",
        "022@a photo of <token> looking off into the distance wearing a striped shirt.png",
        "023@a photo of <token> smiling wearing a blue beanie holding a wine glass with a kitchen table in the background.png",
        "024@a close photo of <token> looking at the camera.png"
    ],
    "training_images_count": 24,
    "training_images_folder_path": "D:\stable-diffusion\training_images\24 Images - captioned"
}

Uso de su configuración para capacitación

 python "main.py" --config_file_path "path/to/the/my-config.json"

Parámetros de línea de comando

dreambooth_helpers arguments.py

Dominio	Tipo	Ejemplo	Descripción
`--config_file_path`	cadena	`"C:\Users\David\Dreambooth Configs\my-config.json"`	La ruta el archivo de configuración para usar
`--project_name`	cadena	`"My Project Name"`	Nombre del proyecto
`--debug`	bool	`False`	El valor predeterminado opcional a `False` . Habilitar el registro de depuración
`--seed`	intencionalmente	`23`	Valores predeterminados opcionales a `23` . Semilla para semilla_everything
`--max_training_steps`	intencionalmente	`3000`	Número de pasos de entrenamiento para funcionar
`--token`	cadena	`"owhx"`	Token único que desea representar a su modelo capacitado.
`--token_only`	bool	`False`	El valor predeterminado opcional a `False` . Entrena solo usando el token y sin clase.
`--training_model`	cadena	`"D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt"`	Ruta al modelo a entrenar (model.ckpt)
`--training_images`	cadena	`"D:\stable-diffusion\training_images\24 Images - captioned"`	Directorio de imágenes de camino hacia el entrenamiento
`--regularization_images`	cadena	`"D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim"`	Camino hacia el directorio con imágenes de regularización
`--class_word`	cadena	`"woman"`	Haga coincidir class_word con la categoría de imágenes que desea entrenar. Ejemplo: `man` , `woman` , `dog` o `artstyle` .
`--flip_p`	flotar	`0.0`	Opcional predeterminados a `0.5` . Porcentaje de flip. Ejemplo: si se establece en `0.5` , volteará (reflejará) sus imágenes de entrenamiento el 50% del tiempo. Esto ayuda a expandir su conjunto de datos sin necesidad de incluir más imágenes de capacitación. Esto puede conducir a peores resultados para el entrenamiento facial ya que las caras de la mayoría de las personas no son perfectamente simétricas.
`--learning_rate`	flotar	`1.0e-06`	El valor predeterminado opcional a `1.0e-06` (0.000001). Establezca la tasa de aprendizaje. Acepta notación científica.
`--save_every_x_steps`	intencionalmente	`250`	Valores predeterminados opcionales a `0` . Guarda un punto de control cada X pasos. En `0` solo guarda al final del entrenamiento cuando se alcanza `max_training_steps` .
`--gpu`	intencionalmente	`0`	Valores predeterminados opcionales a `0` . Especifique una GPU que no sea 0 para usar para el entrenamiento. El soporte multi-GPU no se implementa actualmente.

Uso de su configuración para capacitación

 python "main.py" --project_name "My Project Name" --max_training_steps 3000 --token "owhx" --training_model "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt" --training_images "D:\stable-diffusion\training_images\24 Images - captioned" --regularization_images "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim" --class_word "woman" --flip_p 0.0 --save_every_x_steps 500

Subtítulos y múltiples materias/soporte de concepto

Se admiten subtítulos. Aquí está la guía sobre cómo los implementamos.

Digamos que su token es Effy y su clase es persona, su raíz de datos es /entrena entonces:

training_images/img-001.jpg está subtitulado con effy person

Puede personalizar el subtítulos agregándolo después de un símbolo @ en el nombre de archivo.

/training_images/img-001@a photo of effy => a photo of effy

Puede usar dos tokens en sus subtítulos S - mayúsculas S - y C - C -mayúsculas C - para indicar sujeto y clase.

/training_images/img-001@S being a good C.jpg => effy being a good person

Para crear un nuevo tema, solo necesita crear una carpeta para ello. Entonces:

/training_images/bingo/img-001.jpg => bingo person

La clase permanece igual, pero ahora el tema ha cambiado.

De nuevo, el token S ahora es bingo:

/training_images/bingo/img-001@S is being silly.jpg => bingo is being silly

Una carpeta más profunda y puede cambiar la clase: /training_images/bingo/dog/img-001@S being a good C.jpg => bingo being a good dog

No Come The Kicker: One Level más profundo y puede subtitular un grupo de imágenes: /training_images/effy/person/a picture of/img-001.jpg => a picture of effy person

Inversión textual vs. Dreambooth

La mayoría del código en este repositorio fue escrito por Rinon Gal et. Al, los autores del documento de investigación de inversión textual. Aunque se agregaron algunas ideas sobre imágenes de regularización y preservación previa de pérdidas (ideas de "Dreambooth"), por respeto tanto al equipo del MIT como a los investigadores de Google, estoy renombrando esta bifurcación para: "El repositorio anteriormente conocido como" Dreambooth "" .

Para una implementación alternativa, consulte "Opción alternativa" a continuación.

Usando el modelo generado

La ground truth (imagen real, precaución: mujer muy hermosa)

El mismo mensaje para todas estas imágenes a continuación:

`sks person`	`woman person`	`Natalie Portman person`	`Kate Mara person`

Depuración de sus resultados

❗❗ El error número uno que la gente comete ❗❗

Solicitando solo tu token. es decir, "Joepenna" en lugar de "Joepenna Person"

Si entrenó con joepenna bajo la person de la clase, el modelo solo debe conocer su cara como:

 joepenna person

Ejemplo de indicaciones:

Incorrecto ( person desaparecida después de joepenna )

 portrait photograph of joepenna 35mm film vintage glass

✅ Esto es correcto ( person está incluida después de joepenna )

 portrait photograph of joepenna person 35mm film vintage glass

A veces puede obtener a alguien que se parezca a usted con Joepenna (especialmente si entrenó para demasiados pasos), pero eso es solo porque esta iteración actual de Dreambooth sobrevierte que token tanto que desanece en esa ficha.

☢ Tenga cuidado con los tipos de imágenes que entrena

Mientras entrenaba, Stable no sabe que eres una persona. Solo va a imitar lo que ve.

Entonces, si estas son sus imágenes de entrenamiento, se ven así:

Solo obtendrás generaciones de ti afuera al lado de un árbol puntiagudo, con una camisa blanca y gris, al estilo de ... bueno, fotografía selfie.

En cambio, este conjunto de entrenamiento es mucho mejor:

Lo único que es consistente entre las imágenes es el tema. Por lo tanto, Stable mirará a través de las imágenes y aprenderá solo su cara, lo que hará posible "editarlo" en otros estilos.

¡Oh, no! ¡No estás obteniendo buenas generaciones!

Opción 1: ¡No se parecen a usted en absoluto! (Entrenar más tiempo, o obtener mejores imágenes de entrenamiento)

¿Estás seguro de que lo estás indicando bien?

Debe ser <token> <class> , no solo <token> . Por ejemplo:

JoePenna person, portrait photograph, 85mm medium format photo

Si todavía no se parece a usted, no entrenaste lo suficiente.

Opción 2: se parecen a usted, pero todos se parecen a sus imágenes de entrenamiento. (Entrene para menos pasos, obtenga mejores imágenes de entrenamiento, arregle con la solicitud)

De acuerdo, algunas razones por las cuales: podrías haber entrenado demasiado tiempo ... o tus imágenes fueron demasiado similares ... o no entrenaste con suficientes imágenes.

Ningún problema. Podemos arreglar eso con el aviso. La difusión estable pone mucho mérito a lo que escriba primero. Así que guárdelo para más tarde:

an exquisite portrait photograph, 85mm medium format photo of JoePenna person with a classic haircut

Opción 3: se parecen a usted, pero no cuando prueban diferentes estilos. (Entrena más tiempo, obtenga mejores imágenes de entrenamiento)

No entrenaste lo suficiente ...

Ningún problema. Podemos arreglar eso con el aviso:

JoePenna person in a portrait photograph, JoePenna person in a 85mm medium format photo of JoePenna person

Más consejos y ayuda aquí: Discusión de difusión estable Dreambooth Discord

Difusores de la cara abrazada - Opción alternativa

Dreambooth ahora es compatible con los difusores de Huggingface para entrenar con difusión estable.

Pruébelo aquí:

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-02-25
tamaño 14.09MB
Proviene de Github

Aplicaciones relacionadas

stable diffusion webui forge

2024-11-08
GitHub sgrebnov/cordova plugin background download

2024-11-05
krita ai diffusion

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
stable diffusion webui

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo