detail_tts
1.0.0
Model yang baru diusulkan tiga metode penting penting untuk menjadi praktik terbaik dari are.

Berikut adalah hasil yang diperoleh setelah model dilatih pada 10.000 jam data yang sangat kotor. Model ini dapat dengan mudah ditingkatkan dengan banyak data berkualitas rendah.
prompt 0
dihasilkan 0
Prompt 1
dihasilkan 1
prompt 2
dihasilkan 2
Periksa api.py
Ubah jalur berisi audio dalam skrip dan jalankan
python prepare/0_vad_asr_save_to_jsonl.py
accelerate launch train.py
Untuk fine tuning, ubah jalur beban model pretrain.
VQ dan VIT dari GSV
Difusi dan GPT dari kura -kura