Tagger d'image manuel basé sur le Web pour la formation de modèles de diffusion stable et de Dreambooth personnalisés.

Candy Machine est un tagger d'image naissant pour le marquage manuellement de petits ensembles de données (<images 1k) avec des fichiers de légende .txt :
Disposition de balises personnalisable pour un étiquetage cohérent
Modèles de balise d'espace réservé : IE {type} clothes , où {type} peut être spécifié lors de l'ajout d'une balise
Édition d'image intégrée (Crop, tourne et flip horizontal)
Tag Suggestions à l'aide de wd-v1-4-convnext-tagger.v3 Lors de la création d'un nouveau projet
Conversion automatique de fichiers en .png à partir de .webp, .avif, .gif, etc.
Progress% Pie Tarte - pour ces moments où vous vous demandez «suis-je encore fini ?!»
Raccourcis clavier - appuyez sur '?' pour une liste
Et plus à venir bientôt!
Candy Machine fonctionne entièrement sur votre machine locale en mode "joueur". Aucune information n'est transmise à un système tiers.

J'ai été inspiré par ce post Reddit sur la meilleure façon de marquer les ensembles de données de petites images, en me concentrant principalement sur la cohérence.
Je n'ai pas non plus aimé les parties "délicates" de la construction d'un ensemble de données - convertir des images, les renommer, les recadrage, etc. Je veux faire des ensembles de données de construction rapidement, faciles et, qui sait, peut-être même amusant!
H / T à Binaryalley également pour leur prototype.
Ce logiciel est entièrement gratuit pour une utilisation personnelle et non commerciale. Si vous l'utilisez dans un contexte commercial ou pour un usage commercial (c'est-à-dire pour en faire de l'argent), veuillez me contacter pour organiser une licence payante. Cela aidera à soutenir mes coûts de développement.
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run Une fenêtre de navigateur doit s'ouvrir automatiquement: http://127.0.0.1:5000/
(Remarque, je n'ai pas encore testé cela, il peut y avoir des bugs!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh Une fenêtre de navigateur doit s'ouvrir automatiquement: http://127.0.0.1:5000/
Nécessite CUDA 12.2 et CUDNN8.x.
Activez le Venv Python. (Regardez à l'intérieur run.bat pour des indices sur la façon de le faire.)
Installer onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ Impossible de modifier la disposition des balises d'un projet ou la disposition de balises par défaut dans l'application. (Solution de contournement: modifiez default_categories.json dans le répertoire du serveur, ou categories.json d'un projet.json. Pour ce dernier, assurez-vous de ne pas supprimer les balises qui sont activement utilisées, sinon ils seront orphelins à la fin de la liste des balises si vous enregistrez cette image à l'avenir.)
Impossible d'ajouter plus d'images à un projet! (Solution de contournement: créez un nouveau projet. Je sais, pas idéal.)
Impossible de modifier le mot / synonymes de déclenchement. (Solution de contournement: modifiez la config.json du projet et tous les fichiers de légende .txt existants.)
Pile technologique:
Avant de passer du temps à écrire du code, veuillez ouvrir un problème avec votre proposition afin que nous puissions discuter. Merci!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txtPrérequis: nœud et fil.
cd ui
yarn start cd server
python main.py Veuillez m'envoyer un message ou ouvrir un problème. Merci!