AI視頻遊戲角色生成器
概述
該項目利用穩定擴散,Dreambooth和Lora Technologies的力量來生成高度可定制和獨特的視頻遊戲角色。該系統有助於創造者生成詳細的角色圖像,提高創造力並提供各種角色設計可能性。
特徵
- 自定義字符生成:創建具有獨特視覺特徵和屬性的視頻遊戲字符。
- 高級微調:利用Dreambooth和Lora進行精確的模型調整和增強。
- 高靈活性:適合各種遊戲和角色風格。
技術細節
技術堆棧
- 穩定擴散:用於基本字符圖像產生。
- Dreambooth :用於微調通用模型以識別並生成新的特定角色。
- LORA(低等級適應) :適用於輕巧有效的模型微調,重點是增強生成的字符的特定方面。
數據集
該數據集由從12個不同的視頻遊戲中收集的31,800張圖像組成,並使用DeepDanbooru和Blip等工具進行深刻標籤,以進行準確的屬性分類。
模型架構
- 基本模型:穩定的擴散V1.5,生成詳細的基本圖像。
- Dreambooth改編:增強了模型生成新的特定角色而不會失去一般功能的能力。
- LORA適應:提供最小的計算資源提供有針對性的改進,適合單個字符增強。
安裝
git clone https://github.com/VaradhKaushik/Ai-character-generation.git
cd Ai-character-generation
pip install -r requirements.txt
未來範圍
- 下一步是使用這種方法嘗試不同的模型。
- 在高分辨率數據集上微調模型。
- Comibne Lora和我們的Dreambooth訓練有素的模型。
- 嘗試訓練樣式,衣服,概念洛拉斯並進行比較。
- 探索使用Lycoris進行微調的使用。
參考
- https://huggingface.co/runwayml/stable-diffusion-v1-5
- https://github.com/shivamshrirao/diffusers/tree/main/main/examples/dreambooth
- https://huggingface.co/blog/stable_diffusion
- https://huggingface.co/docs/diffusers/training/lora?installation=PyTorch
- https://github.com/huggingface/diffusers/tree/main/main/examples/text_to_image
- https://civitai.com/models/4468?modelversionId=57618
- https://github.com/automatic1111/stable-diffusion-webui
- https://huggingface.co/openai/clip-vit-base-patch32
- https://github.com/kichangkim/deepdanbooru
團隊成員
Alexander Seljuk,Varadh Kaushik,Girish Adari Kumar