Webbasierter manueller Bild Tagger für das Training benutzerdefinierte stabile Diffusionsloras & Dreambooth-Modelle

Candy Machine ist ein aufstrebender Bild -Tagger für das manuelle Markieren kleiner Datensätze (<1K -Bilder) mit .txt -Bildunterschriftendateien:
Anpassbares Tag -Layout für konsistentes Markieren
Platzhalter -Tag -Vorlagen : IE {type} clothes , wobei {type} angegeben werden kann, wenn ein Tag hinzugefügt wird
Eingebaute Bildbearbeitung (Ernte, horizontal drehen und flip)
Tag-Vorschläge mit wd-v1-4-convnext-tagger.v3 beim Erstellen eines neuen Projekts
Automatische Dateikonvertierung zu .png von .Webp, .avif, .gif usw.
Fortschritt % Kreisdiagramm - für die Zeiten, in denen Sie sich fragen , "bin ich schon gemacht?!"
Tastaturverknüpfungen - drücken Sie '?' für eine Liste
Und bald kommen bald!
Candy Machine läuft vollständig auf Ihrem lokalen Computer im "Einzelspieler" -Modus. Es werden keine Informationen an ein System von Drittanbietern übertragen.

Ich war von diesem Reddit -Beitrag inspiriert, wie kleine Bilddatensätze am besten gekennzeichnet werden können, wobei ich hauptsächlich auf Konsistenz konzentriert wurde.
Ich habe auch nie die "fummeligen" Teile des Erstellens eines Datensatzes geliebt, um Bilder zu konvertieren, sie umzubenennen, zuschneiden usw. Ich möchte das Erstellen von Datensätzen schnell, einfach machen und wer weiß, vielleicht sogar Spaß!
H/T nach Binaryalley auch für ihren Prototyp.
Diese Software ist für den persönlichen, nicht kommerziellen Gebrauch völlig kostenlos. Wenn Sie es in einem geschäftlichen Kontext oder zur kommerziellen Verwendung verwenden (dh, um Geld damit zu verdienen), kontaktieren Sie mich bitte, um eine kostenpflichtige Lizenz zu vereinbaren. Dies wird dazu beitragen, meine Entwicklungskosten zu unterstützen.
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run Ein Browserfenster sollte automatisch geöffnet werden: http://127.0.0.1:5000/
(Beachten Sie, ich habe das noch nicht getestet, es gibt möglicherweise Fehler!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh Ein Browserfenster sollte automatisch geöffnet werden: http://127.0.0.1:5000/
Benötigt CUDA 12.2 und CUDNN8.x.
Aktivieren Sie das Python -Venv. (Schauen Sie im Inside Run.bat nach Hinweisen, wie es geht.)
Installieren Sie onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ Das Tag -Layout eines Projekts oder das Standard -Tag -Layout in der App kann nicht bearbeiten. (Problemumgehung: Bearbeiten Sie default_categories.json im Serververzeichnis oder categories.json eines Projekts.json. Für letztere werden Sie sicherstellen, dass Sie keine Tags entfernen, die aktiv verwendet werden, sonst werden sie am Ende der Tag -Liste verwaiste, wenn Sie dieses Bild in der Zukunft speichern.)
Nicht mehr Bilder zu einem Projekt hinzufügen! (Problemumgehung: Erstellen Sie ein neues Projekt. Ich weiß, nicht ideal.)
Das Trigger -Wort / die Synonyme kann nicht bearbeiten. (Problemumgehung: Bearbeiten Sie die config.json des Projekts und alle vorhandenen .txt -Bildunterschriften.)
Tech Stack:
Bevor Sie Zeit mit dem Schreiben von Code verbringen, öffnen Sie bitte ein Problem mit Ihrem Vorschlag, damit wir diskutieren können. Danke!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txtVoraussetzungen: Knoten und Garn.
cd ui
yarn start cd server
python main.py Bitte senden Sie mir eine Nachricht oder öffnen Sie ein Problem. Danke!