تنزيل UTAUTAI - تنزيل رمز المصدر UTAUTAI

UTAUTAI

كود الذكاء الاصطناعي

1.0.0

تنزيل

Utautai: Tune غير المقيد التكنولوجيا الآلية التداخل الاصطناعي

ReadMe

فهرس سريع

النموذج العمارة
؟ ما هو utautai؟
؟طريقة
؟ تودو
تقدير
️ إظهار دعمكم
؟ ترحيب المساهمات

النموذج العمارة

Utautai العمارة الرئيسية ؟ آسف على السحب

؟ ما هو utautai؟

مستودع مفتوح المصدر يهدف إلى توليد مسارات صوتية ومفيدة من كلمات الأغاني ، على غرار غرد Suno AI.

؟طريقة

طريقة Utautai مستوحاة بشكل أساسي من TTS Spear

أثناء التدريب ، تتكون المدخلات من الرموز الدلالية التي تم الحصول عليها من "Lyrics2Semantic AR" ، والتي تستخرج الرموز الدلالية من كلمات الأغاني ، وكذلك الرموز الصوتية. بالإضافة إلى ذلك ، تتعرض تمثيلات MERT المستمدة من الموسيقى لقياس K-Means للحصول على مزيد من الرموز الدلالية.

ومع ذلك ، أثناء الاستدلال ، لا يمكن الحصول على تمثيلات Mert من الموسيقى. لذلك ، نقوم بتدريب وحدة نمطية باتباع منهجية TTS2 المطالبة للحصول على تمثيلات Mert المستهدفة من المطالبة أثناء الاستدلال. تتكون الوحدة النمطية من نموذج انتشار قائم على المحولات.

أعتقد أنه باستخدام هذا النهج ، يمكننا تحقيق المهام المستهدفة بنجاح. ماذا تعتقد؟

؟ تودو

كيف يمكننا الحصول على كلمات تتطابق مع الصوت المزروع؟ أو هل يجب أن نقص الصوت في المقام الأول؟ شفرة
فحص معالجة التمييز الصوتي والرموز الخاصة ، وقم بإجراء تعديلات رمز ضرورية. شفرة
تصحيح المجمع في مجموعة البيانات. شفرة
أكمل رمز الاستدلال stylemodule. شفرة
إصلاحات رمز ثانوية أخرى ، مثل استراتيجيات التقنيع.
القضاء على نموذج الانتشار وتكييف نموذج الاتساق.