Tagger gambar manual berbasis web untuk melatih Difusi Loras & Model Dreambooth yang stabil kustom

Candy Machine adalah tagger gambar yang baru lahir untuk menandai dataset kecil secara manual (<1k gambar) dengan file caption .txt :
Tata letak tag yang dapat disesuaikan untuk penandaan yang konsisten
Templat Tag Placeholder : IE {type} clothes , di mana {type} dapat ditentukan saat menambahkan tag
Pengeditan gambar in-built (CROP, ROTATE dan FLIP HORIZONTAL)
Tag Saran Menggunakan wd-v1-4-convnext-tagger.v3 Saat membuat proyek baru
Konversi file otomatis ke .png dari .webp, .avif, .gif, dll
Progress % Pie Chart - untuk saat -saat ketika Anda bertanya -tanya 'apakah saya sudah selesai?!'
Pintasan keyboard - tekan '?' untuk daftar
Dan lebih banyak lagi segera hadir!
Mesin permen berjalan sepenuhnya pada mesin lokal Anda dalam mode "pemain tunggal". Tidak ada informasi yang ditransmisikan ke sistem pihak ke -3.

Saya terinspirasi oleh posting Reddit ini tentang cara terbaik menandai kumpulan data gambar kecil, terutama berfokus pada konsistensi.
Saya juga tidak pernah menyukai bagian "fiddly" dari membangun dataset - mengonversi gambar, mengubah nama, memangkas dll. Saya ingin membuat dataset bangunan cepat, mudah dan, siapa tahu, bahkan mungkin menyenangkan!
H/t ke Binaryalley juga untuk prototipe mereka.
Perangkat lunak ini sepenuhnya gratis untuk penggunaan pribadi, non-komersial. Jika Anda menggunakannya dalam konteks bisnis atau untuk penggunaan komersial (yaitu menghasilkan uang darinya), silakan hubungi saya untuk mengatur lisensi berbayar. Ini akan membantu mendukung biaya pengembangan saya.
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run Jendela browser harus terbuka secara otomatis: http://127.0.0.1:5000/
(Catatan, saya belum menguji ini, mungkin ada bug!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh Jendela browser harus terbuka secara otomatis: http://127.0.0.1:5000/
Membutuhkan Cuda 12.2 dan Cudnn8.x.
Aktifkan venv Python. (Lihat di dalam run.bat untuk petunjuk tentang cara melakukannya.)
Instal onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ Tidak dapat mengedit tata letak tag proyek atau tata letak tag default di dalam aplikasi. (Penanganan Solusi: Edit default_categories.json di direktori server, atau categories.json proyek. JSON. Untuk yang terakhir, pastikan untuk tidak menghapus tag yang secara aktif digunakan, jika tidak mereka akan yatim di akhir daftar tag jika Anda menyimpan gambar itu di masa depan.)
Tidak dapat menambahkan lebih banyak gambar ke suatu proyek! (Penanganan masalah: Buat proyek baru. Saya tahu, tidak ideal.)
Tidak dapat mengedit kata pemicu / sinonim. (Penanganan: Edit config.json proyek dan semua file .txt Caption yang ada.)
Tumpukan Tech:
Sebelum menghabiskan waktu menulis kode, buka masalah dengan proposal Anda sehingga kami dapat berdiskusi. Terima kasih!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txtPrasyarat: Node dan Benang.
cd ui
yarn start cd server
python main.py Tolong kirimkan saya pesan, atau buka masalah. Terima kasih!