Tagger de imagem manual baseada na Web para treinamento de difusão estável personalizada Loras & Dreambooth Models

Candy Machine é um tagger de imagem nascente para marcar manualmente pequenos conjuntos de dados (<1k imagens) com arquivos de legenda .txt :
Layout de tag personalizável para marcação consistente
Modelos de tag de espaço reservado : ie {type} clothes , onde {type} pode ser especificado ao adicionar uma tag
Edição de imagem embutida (corte, gire e flip horizontal)
Sugestões de tags usando wd-v1-4-convnext-tagger.v3 Ao criar um novo projeto
Conversão automática de arquivos para .png de .webp, .avif, .gif, etc
PROGRESS % Gráfico de pizza - Para aqueles momentos em que você se pergunta 'já terminei?!'
Atalhos de teclado - pressione '?' para uma lista
E mais em breve!
A máquina de doces é inteiramente no modo "um único jogador". Nenhuma informação é transmitida a nenhum sistema de terceiros.

Fui inspirado por este post do Reddit sobre como melhor marcar pequenos conjuntos de dados de imagens, concentrando -se principalmente na consistência.
Também nunca amei as partes "complicadas" da construção de um conjunto de dados - convertendo imagens, renomeá -las, cortar etc. Quero tornar os conjuntos de dados de construção rápidos, fáceis e, quem sabe, talvez até divertidos!
H/T para Binário também para seu protótipo.
Este software é totalmente gratuito para uso pessoal e não comercial. Se você estiver usando em um contexto comercial ou para uso comercial (ou seja, para ganhar dinheiro com isso), entre em contato comigo para organizar uma licença paga. Isso ajudará a apoiar meus custos de desenvolvimento.
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run Uma janela do navegador deve abrir automaticamente: http://127.0.0.1:5000/
(Observe que ainda não testei isso, pode haver bugs!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh Uma janela do navegador deve abrir automaticamente: http://127.0.0.1:5000/
Requer CUDA 12.2 e CUDNN8.X.
Ative o Python Venv. (Olhe dentro do run.bat para pistas sobre como fazer isso.)
Instale onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ Não é possível editar o layout de tag de um projeto ou o layout de tag padrão dentro do aplicativo. (Solução alternativa: editar default_categories.json no diretório do servidor, ou categories.json de um projeto.json. Para este último, certifique -se de não remover tags que estão sendo usadas ativamente, caso contrário elas serão órfãs no final da lista de tags se você salvar essa imagem no futuro.)
Não posso adicionar mais imagens a um projeto! (Solução alternativa: crie um novo projeto. Eu sei, não é o ideal.)
Não é possível editar a palavra do gatilho / sinônimos. (Solução alternativa: edite a config.json do projeto e todos os arquivos de legenda .txt existentes.)
Pilha de tecnologia:
Antes de gastar qualquer tempo escrevendo código, abra um problema com sua proposta para que possamos discutir. Obrigado!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txtPré -requisitos: nó e fios.
cd ui
yarn start cd server
python main.py Envie -me uma mensagem ou abra um problema. Obrigado!