detail_tts
1.0.0
اقترح النموذج حديثًا ثلاث طرق مهمة مهمة لتصبح أفضل ممارسة لـ AR TTS.

فيما يلي النتيجة التي تم الحصول عليها بعد تدريب النموذج على 10000 ساعة من البيانات القذرة للغاية. يمكن توسيع نطاق النموذج بسهولة مع العديد من بيانات الجودة المنخفضة.
موجه 0
ولدت 0
موجه 1
ولدت 1
موجه 2
ولدت 2
تحقق api.py
تغيير المسار يحتوي على الصوت في البرنامج النصي وتشغيله
python prepare/0_vad_asr_save_to_jsonl.py
accelerate launch train.py
للضبط الدقيق ، قم بتغيير مسار تحميل نموذج ما قبل الأثرياء.
VQ و Vits من GSV
الانتشار و GPT من السلحفاة