
ด้วยโครงการนี้คุณสามารถใช้ AI เพื่อสร้างแทร็กเพลงและคลิปวิดีโอ ให้ข้อมูลบางอย่างเกี่ยวกับวิธีที่คุณต้องการเพลงและวิดีโอรหัสจะทำส่วนที่เหลือ
ก่อนอื่นเราใช้โมเดล Generative เพื่อสร้างตัวอย่างเพลงโมเดลเริ่มต้นที่ใช้ที่นี่สามารถสร้างเพลงได้สูงสุด 30 วินาทีด้วยเหตุนี้เราจึงก้าวไปอีกขั้นเพื่อขยายเพลง หลังจากจบด้วยส่วนเสียงเราสามารถสร้างวิดีโอก่อนอื่นเราเริ่มต้นด้วยโมเดลการแพร่กระจายที่เสถียรเพื่อสร้างภาพจากนั้นเราใช้รุ่น Generative อื่นเพื่อให้การเคลื่อนไหวและภาพเคลื่อนไหวเล็กน้อย ในการเขียนคลิปวิดีโอสุดท้ายเราใช้เพลงที่สร้างขึ้นแต่ละเพลงและเข้าร่วมกับภาพเคลื่อนไหวมากเท่าที่จำเป็นเพื่อให้ตรงกับความยาวของเพลง
ขั้นตอนทั้งหมดเหล่านั้นจะสร้างไฟล์ระดับกลางที่คุณสามารถตรวจสอบและลบสิ่งที่คุณไม่ต้องการปรับปรุงผลลัพธ์ด้วยตนเอง
วิธีที่แนะนำในการใช้ที่เก็บนี้อยู่กับ Docker แต่คุณยังสามารถใช้ VENV ที่กำหนดเองได้เพียงตรวจสอบให้แน่ใจว่าได้ติดตั้งการอ้างอิงทั้งหมด
หมายเหตุ: ตรวจสอบให้แน่ใจว่าได้อัปเดตพารามิเตอร์อุปกรณ์เพื่อเพิ่มประสิทธิภาพสูงสุด แต่สังเกตว่าบางรุ่นอาจไม่ทำงานสำหรับตัวเลือกอุปกรณ์ทั้งหมด (CPU, CUDA, MPS)
project_dir: beats
project_name: lofi
seed: 42
music:
prompt: "lo-fi music with a relaxing slow melody"
model_id: facebook/musicgen-small
device: cpu
n_music: 5
music_duration: 60
initial_music_tokens: 1050
max_continuation_duration: 20
prompt_music_duration: 10
image:
prompt: "Mystical Landscape"
prompt_modifiers:
- "concept art, HQ, 4k"
- "epic scene, cinematic, sci fi cinematic look, intense dramatic scene"
- "digital art, hyperrealistic, fantasy, dark art"
- "digital art, hyperrealistic, sense of comsmic wonder"
- "mystical and ethereal atmosphere, photo taken with a wide-angle lens"
model_id: stabilityai/sdxl-turbo
device: mps
n_images: 5
inference_steps: 3
height: 576
width: 1024
video:
model_id: stabilityai/stable-video-diffusion-img2vid
device: cpu
n_continuations: 2
loop_video: true
video_fps: 6
decode_chunk_size: 8
motion_bucket_id: 127
noise_aug_strength: 0.1
audio_clip:
n_music_loops: 1
สร้างภาพนักเทียบท่า
make buildใช้ผ้าสำลีและการจัดรูปแบบกับรหัส (จำเป็นสำหรับการพัฒนาเท่านั้น)
make lintเรียกใช้ไปป์ไลน์ทั้งหมดเพื่อสร้างมิวสิควิดีโอ
make ai_beatsเรียกใช้ขั้นตอนการสร้างเพลง
make musicเรียกใช้ขั้นตอนต่อเนื่องทางดนตรี
make music_continuationเรียกใช้ขั้นตอนการสร้างภาพ
make imageเรียกใช้ขั้นตอนการสร้างวิดีโอ
make videoเรียกใช้ขั้นตอนการสร้างคลิปเสียง
make audio_clip เพื่อการพัฒนาตรวจสอบให้แน่ใจว่าได้ติดตั้ง requirements-dev.txt และเรียกใช้ make lint เพื่อรักษารูปแบบการเข้ารหัส
ฉันพัฒนาและทดสอบโครงการส่วนใหญ่ใน MacBook Pro M2 ของฉันขั้นตอนเดียวที่ฉันไม่สามารถเรียกใช้ได้คือขั้นตอนการสร้างวิดีโอเพราะฉันใช้ Google Colab (พร้อม V100 หรือ A100 GPU) แบบจำลองบางรุ่นไม่สามารถใช้งานได้บน MPS แต่พวกเขาทำงานในเวลาที่เหมาะสม
แบบจำลองที่ใช้โดยค่าเริ่มต้นที่นี่มีใบอนุญาตเฉพาะที่อาจไม่เหมาะสำหรับกรณีการใช้งานทั้งหมดหากคุณต้องการใช้โมเดลเดียวกันตรวจสอบให้แน่ใจว่าได้ตรวจสอบใบอนุญาต สำหรับ Music Generation MusicGen และใบอนุญาต CC-BY-NC 4.0 สำหรับการสร้างภาพ SDXL-Turbo และใบอนุญาต LICANT-SDXL1.0 และการแพร่กระจายวิดีโอที่เสถียร