基於Web的手動圖像標記器用於訓練自定義穩定擴散Loras&Dreambooth模型

Candy Machine是一個新生的圖像標記器,用於用.txt字幕文件手動標記小數據集(<1k images):
可自定義的標籤佈局,用於一致的標籤
佔位符標籤模板:ie {type} clothes ,在添加標籤時可以指定{type}
內部形成的圖像編輯(作物,旋轉和翻轉水平)
創建新項目時使用wd-v1-4-convnext-tagger.v3的標籤建議
自動文件從.webp,.avif,.gif等轉換為.png
進度%餅圖- 在您想知道“我已經做好了嗎?!”的時候
鍵盤快捷鍵- 按'? '對於列表
還有更多即將到來!
糖果機完全在您的本地機器上以“單人玩家”模式運行。沒有信息傳輸到任何第三方系統。

我受到有關如何最好地標記小型圖像數據集的Reddit帖子的啟發,主要關註一致性。
我也從不喜歡構建數據集的“貼心”部分 - 轉換圖像,重命名,裁剪等。我想快速,簡單,簡單,誰知道,甚至很有趣!
H/T到Binaryalley的原型也是如此。
該軟件完全免費用於個人非商業用途。如果您在商業環境或商業用途中使用它(即從中賺錢),請與我聯繫以安排付費許可證。這將有助於支持我的發展成本。
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run瀏覽器窗口應自動打開: http://127.0.0.1:5000/
(請注意,我還沒有測試過,可能有錯誤!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh瀏覽器窗口應自動打開: http://127.0.0.1:5000/
需要Cuda 12.2和Cudnn8.x。
激活Python Venv。 (查看Inside run.bat了解如何做到這一點的線索。)
安裝onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ 無法編輯應用程序中的項目標籤佈局或默認標籤佈局。 (解決方法:編輯default_categories.json在服務器目錄中或一個項目的categories.json 。對於後者,請確保不要刪除正在積極使用的標籤,否則,如果將來保存該圖像,它們將在標籤列表的末端被孤兒。
無法在項目中添加更多圖像! (解決方法:創建一個新項目。我知道,不是理想的。)
無法編輯觸發單詞 /同義詞。 (解決方法:編輯項目的config.json和所有現有的.txt字幕文件。)
技術堆棧:
在花費任何時間編寫代碼之前,請與您的提案打開一個問題,以便我們討論。謝謝!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txt先決條件:節點和紗線。
cd ui
yarn start cd server
python main.py 請給我發送消息或打開問題。謝謝!