detail_tts
1.0.0
該模型新提出的三種重要的重要方法是成為AR TT的最佳實踐。

這是對模型在10000小時非常臟數據進行培訓後獲得的結果。該模型可以通過許多低質量的數據輕鬆擴展。
提示0
生成0
提示1
生成1
提示2
生成2
檢查api.py
更改路徑包含腳本中的音頻並運行
python prepare/0_vad_asr_save_to_jsonl.py
accelerate launch train.py
對於微調,請更改預處理模型負載路徑。
VQ和GSV的VIT
從烏龜擴散和gpt