AI视频游戏角色生成器
概述
该项目利用稳定扩散,Dreambooth和Lora Technologies的力量来生成高度可定制和独特的视频游戏角色。该系统有助于创造者生成详细的角色图像,提高创造力并提供各种角色设计可能性。
特征
- 自定义字符生成:创建具有独特视觉特征和属性的视频游戏字符。
- 高级微调:利用Dreambooth和Lora进行精确的模型调整和增强。
- 高灵活性:适合各种游戏和角色风格。
技术细节
技术堆栈
- 稳定扩散:用于基本字符图像产生。
- Dreambooth :用于微调通用模型以识别并生成新的特定角色。
- LORA(低等级适应) :适用于轻巧有效的模型微调,重点是增强生成的字符的特定方面。
数据集
该数据集由从12个不同的视频游戏中收集的31,800张图像组成,并使用DeepDanbooru和Blip等工具进行深刻标签,以进行准确的属性分类。
模型架构
- 基本模型:稳定的扩散V1.5,生成详细的基本图像。
- Dreambooth改编:增强了模型生成新的特定角色而不会失去一般功能的能力。
- LORA适应:提供最小的计算资源提供有针对性的改进,适合单个字符增强。
安装
git clone https://github.com/VaradhKaushik/Ai-character-generation.git
cd Ai-character-generation
pip install -r requirements.txt
未来范围
- 下一步是使用这种方法尝试不同的模型。
- 在高分辨率数据集上微调模型。
- Comibne Lora和我们的Dreambooth训练有素的模型。
- 尝试训练样式,衣服,概念洛拉斯并进行比较。
- 探索使用Lycoris进行微调的使用。
参考
- https://huggingface.co/runwayml/stable-diffusion-v1-5
- https://github.com/shivamshrirao/diffusers/tree/main/main/examples/dreambooth
- https://huggingface.co/blog/stable_diffusion
- https://huggingface.co/docs/diffusers/training/lora?installation=PyTorch
- https://github.com/huggingface/diffusers/tree/main/main/examples/text_to_image
- https://civitai.com/models/4468?modelversionId=57618
- https://github.com/automatic1111/stable-diffusion-webui
- https://huggingface.co/openai/clip-vit-base-patch32
- https://github.com/kichangkim/deepdanbooru
团队成员
Alexander Seljuk,Varadh Kaushik,Girish Adari Kumar