Générateur de personnages de jeux vidéo AI
Aperçu
Ce projet exploite la puissance de la diffusion stable, Dreambooth et des technologies LORA pour générer des personnages de jeux vidéo hautement personnalisables et uniques. Ce système aide les créatifs pour générer des images de personnages détaillées, stimuler la créativité et offrir une vaste gamme de possibilités de conception de personnages.
Caractéristiques
- Génération de personnages personnalisés : créez des personnages de jeux vidéo avec des traits et des attributs visuels uniques.
- Fonction avancé : utilise Dreambooth et Lora pour un réglage et une amélioration du modèle précis.
- Flexibilité élevée : adapté à une large gamme de jeux et de styles de personnages.
Détails techniques
Pile technologique
- Diffusion stable : pour la génération d'images de caractères de base.
- Dreambooth : pour affiner le modèle à usage général pour reconnaître et générer de nouveaux caractères spécifiques.
- LORA (Adaptation à faible rang) : appliqué pour un réglage fin léger et efficace, en se concentrant sur l'amélioration des aspects spécifiques des caractères générés.
Ensemble de données
L'ensemble de données se compose de 31 800 images collectées à partir de 12 jeux vidéo différents, avec un étiquetage profond à l'aide d'outils comme Deepdanbooru et Blip pour une classification précise des attributs.
Architecture modèle
- Modèle de base : diffusion stable v1.5, générant des images de base détaillées.
- Adaptation Dreambooth : améliore la capacité du modèle à générer de nouveaux caractères spécifiques sans perdre des capacités générales.
- Adaptation LORA : fournit des améliorations ciblées avec un minimum de ressources de calcul, adaptées aux améliorations à caractère unique.
Installation
git clone https://github.com/VaradhKaushik/Ai-character-generation.git
cd Ai-character-generation
pip install -r requirements.txt
Portée future
- L'étape suivante consiste à essayer différents modèles avec cette approche.
- Affinez le modèle sur un ensemble de données haute résolution.
- Comibne Lora et notre modèle formé Dreambooth.
- Essayez le style de formation, les vêtements, le concept Loras et comparez les résultats.
- Explorez l'utilisation de la lycoris pour le réglage du modèle.
Références
- https://huggingface.co/runwayml/stable-diffusion-v1-5
- https://github.com/shivamshrirao/diffusers/tree/main/examples/dreambooth
- https://huggingface.co/blog/stable_diffusion
- https://huggingface.co/docs/diffusers/training/lora?installation=pytorch
- https://github.com/huggingface/diffusers/tree/main/examples/text_to_image
- https://civitai.com/models/4468?modelversionid=57618
- https://github.com/automatic1111/stable-diffusion-webui
- https://huggingface.co/openai/clip-vit-base-patch32
- https://github.com/kichangkim/deepdanbooru
Membres de l'équipe
Alexander Seljuk, Varadh Kaushik, Girish Adari Kumar