Tagger de imagen manual basado en la web para capacitación de modelos de difusión estable personalizada y modelos Dreambooth

Candy Machine es un etiqueta de imagen naciente para etiquetar manualmente pequeños conjuntos de datos (<1k imágenes) con archivos .txt de subtítulos:
Diseño de etiqueta personalizable para etiquetado consistente
Plantillas de etiqueta de marcador de posición : IE {type} clothes , donde se puede especificar {type} al agregar una etiqueta
Edición de imagen incorporada (cultivo, giro y voltee horizontal)
Sugerencias de etiqueta utilizando wd-v1-4-convnext-tagger.v3 al crear un nuevo proyecto
Conversión automática de archivos a .png de .webp, .avif, .gif, etc.
Progreso % Pide Chart - Para esos momentos en los que te preguntas '¿Ya he terminado?
Accesos directos de teclado - Presione '?' para una lista
¡Y más próximamente!
Candy Machine se ejecuta completamente en su máquina local en modo "Un para un jugador". Ninguna información se transmite a ningún sistema de terceros.

Me inspiré en esta publicación de Reddit sobre cómo etiquetar mejor los conjuntos de datos de imágenes pequeñas, centrándome principalmente en la consistencia.
Tampoco me han encantado las partes "complicadas" de la construcción de un conjunto de datos: convertir imágenes, renombrarlas, recortar, etc. ¡Quiero que la construcción de conjuntos de datos sea rápido, fácil y, quién sabe, tal vez incluso divertido!
H/T a Binaryalley también para su prototipo.
Este software es completamente gratuito para uso personal y no comercial. Si lo está utilizando en un contexto comercial o para uso comercial (es decir, para ganar dinero), comuníquese conmigo para organizar una licencia pagada. Esto ayudará a apoyar mis costos de desarrollo.
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
run Una ventana del navegador debe abrirse automáticamente: http://127.0.0.1:5000/
(Tenga en cuenta que aún no he probado esto, ¡puede haber errores!)
git clone [email protected]:mikeknapp/candy-machine.git
cd candy-machine
chmod +x run.sh
./run.sh Una ventana del navegador debe abrirse automáticamente: http://127.0.0.1:5000/
Requiere CUDA 12.2 y CUDNN8.X.
Active el Python Venv. (Mire dentro de la carrera. Bat en busca de pistas sobre cómo hacer eso).
Instalar onnxruntime-gpu
pip install onnxruntime-gpu --extra-index-url
https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/ No se puede editar el diseño de la etiqueta de un proyecto o el diseño de etiqueta predeterminado dentro de la aplicación. (Solución alternativa: editar default_categories.json en el directorio del servidor, o categories.json de un proyecto.json. Para este último, asegúrese de no eliminar las etiquetas que se usan activamente, de lo contrario se huérfano al final de la lista de etiquetas si guarda esa imagen en el futuro).
¡No se puede agregar más imágenes a un proyecto! (Solución: crear un nuevo proyecto. Lo sé, no ideal).
No se puede editar la palabra de activación / sinónimos. (Solución alternativa: edite el config.json del proyecto y todos los archivos de subtítulos .txt existentes).
Pila tecnológica:
Antes de pasar el tiempo escribiendo código, abra un problema con su propuesta para que podamos discutir. ¡Gracias!
python -m venv venv
call .venvScriptsactivate
pip install -r requirements.txtPrerrequisitos: nodo e hilo.
cd ui
yarn start cd server
python main.py Por favor envíeme un mensaje o abra un problema. ¡Gracias!