AI 비디오 게임 캐릭터 생성기
개요
이 프로젝트는 안정적인 확산, Dreambooth 및 LORA 기술의 힘을 활용하여 고도로 사용자 정의 가능하고 독특한 비디오 게임 캐릭터를 생성합니다. 이 시스템은 세부적인 캐릭터 이미지를 생성하고 창의성을 높이고 다양한 캐릭터 디자인 가능성을 제공하는 데 크리에이티브를 지원합니다.
특징
- 맞춤형 문자 생성 : 독특한 시각적 특성과 속성으로 비디오 게임 캐릭터를 만듭니다.
- 고급 미세 조정 : DreamBooth와 Lora를 사용하여 정확한 모델 튜닝 및 향상을 위해 사용합니다.
- 높은 유연성 : 광범위한 게임 및 캐릭터 스타일에 적합합니다.
기술적 인 세부 사항
기술 스택
- 안정적인 확산 : 기본 문자 이미지 생성.
- Dreambooth : 새로운 특정 캐릭터를 인식하고 생성하기 위해 범용 모델을 미세 조정하기 위해.
- LORA (LOW RANK ADAPTATION) : 생성 된 문자의 특정 측면을 향상시키는 데 중점을 둔 경량 및 효율적인 모델 미세 조정에 적용됩니다.
데이터 세트
이 데이터 세트는 12 개의 다른 비디오 게임에서 수집 된 31,800 개의 이미지로 구성되며 DeepDanbooru 및 Blip과 같은 도구를 사용하여 정확한 속성 분류를 위해 딥 레이블을 사용합니다.
모델 아키텍처
- 기본 모델 : 안정적인 확산 v1.5, 상세한 기본 이미지를 생성합니다.
- Dreambooth 적응 : 일반적인 기능을 잃지 않고 새로운 특정 캐릭터를 생성하는 모델의 능력을 향상시킵니다.
- LORA 적응 : 단일 문자 향상에 적합한 최소한의 계산 리소스로 목표 개선을 제공합니다.
설치
git clone https://github.com/VaradhKaushik/Ai-character-generation.git
cd Ai-character-generation
pip install -r requirements.txt
미래의 범위
- 다음 단계는이 접근법으로 다른 모델을 시도하는 것입니다.
- 고해상도 데이터 세트에서 모델을 미세 조정하십시오.
- Comibne Lora와 우리의 Dreambooth는 모델을 훈련 시켰습니다.
- 훈련 스타일, 의류, 개념 로라를 시도하고 결과를 비교하십시오.
- 모델 미세 조정에 lycoris의 사용을 탐색하십시오.
참조
- https://huggingface.co/runwayml/stable-diffusion-v1-5
- https://github.com/shivamshrirao/diffusers/tree/main/examples/dreambooth
- https://huggingface.co/blog/stable_diffusion
- https://huggingface.co/docs/diffusers/training/lora?installation=pytorch
- https://github.com/huggingface/diffusers/tree/main/examples/text_to_image
- https://civitai.com/models/4468?modelversionid=57618
- https://github.com/automatic1111/stable-diffusion-webui
- https://huggingface.co/openai/clip-vit-base-patch32
- https://github.com/kichangkim/deepdanbooru
팀원
Alexander Seljuk, Varadh Kaushik, Girish Adari Kumar