? ขออภัยสำหรับการวาดด้วยมือ
พื้นที่เก็บข้อมูลโอเพนซอร์ซมุ่งเป้าไปที่การสร้างเพลงที่เข้าคู่กันและเพลงจากเนื้อเพลงซึ่งคล้ายกับเสียงร้องของ Suno AI และความรุนแรง
วิธีการของ Utautai ส่วนใหญ่ได้รับแรงบันดาลใจจากหอก TTS
ในระหว่างการฝึกอบรมอินพุตประกอบด้วยโทเค็นความหมายที่ได้จาก 'เนื้อเพลง 2Semantic AR' ซึ่งแยกโทเค็นความหมายออกจากเนื้อเพลงรวมถึงโทเค็นอะคูสติก นอกจากนี้การเป็นตัวแทนของ MERT ที่ได้มาจากเพลงนั้นอยู่ภายใต้ปริมาณ K-Mean เพื่อให้ได้โทเค็นความหมายเพิ่มเติม
อย่างไรก็ตามในระหว่างการอนุมานมันเป็นไปไม่ได้ที่จะได้รับการเป็นตัวแทน MERT จากเพลง ดังนั้นเราจึงฝึกอบรมโมดูลสไตล์ตามวิธีการของ Prompt TTS2 เพื่อรับการเป็นตัวแทน MERT เป้าหมายจากพรอมต์ระหว่างการอนุมาน โมดูลสไตล์ประกอบด้วยโมเดลการแพร่กระจายของหม้อแปลง
ฉันคิดว่าการใช้วิธีการนี้เราสามารถทำงานเป้าหมายให้สำเร็จได้สำเร็จ คุณคิดอย่างไร?
หากคุณพบว่า Utautai น่าสนใจและมีประโยชน์ให้เราเป็นดาราบน GitHub! ️กระตุ้นให้เราปรับปรุงรูปแบบและเพิ่มคุณสมบัติที่น่าตื่นเต้น
ยินดีต้อนรับการมีส่วนร่วมเสมอ