Este é um modelo que pode ser usado para treinar vários conceitos e imagens de regularização para modelos Lora (adaptação de baixo rank).
Lora: https://github.com/cloneofsimo/lora
Com base nos scripts de treinamento de Kohya-SS SD-Scripts
| Diretório | Descrição |
|---|---|
image_dir | Contém todas as imagens de entrada e arquivos de legenda, prefixados pelo número total de época por imagem |
reg_dir | Contém todas as imagens de regularização por conceito, prefixadas pelo número total de repetições por imagem |
log | registros de cada registro de treinamento |
output | O binário final de saída (Safesensor, Pt, etc) |
config_v1_example.json | A configuração da sessão de treinamento (renomeie o que você quiser) |
Equilibre os conjuntos de dados para que as pastas conceituais indiquem o número de vezes que elas devem ser repetidas durante o treinamento.
Por exemplo, digamos que você tenha quatro conceitos e cada um deles tem 14 imagens por conceito, exceto um, que tem 28 .
Para equilibrar isso para as etapas de treinamento por conceito por época 5200 , você dividiria as repetições pela quantidade total de imagens por conceito:
5200 / 14 = 371 5200 / 28 = 186
No exemplo, o nome dos diretórios conceituais seria:
O utilitário abaixo garantirá que cada pasta conceitual na pasta do conjunto de dados seja usada igualmente durante o processo de treinamento do modelo de aprendizado de máquina Dreambooth, independentemente do número de imagens em cada pasta:
https://github.com/bmaltais/kohya_ss/blob/cdf84e2f4b65517c396ffb72474616a57bc109b6/library/dataset_balancing_gui.py