MB iSTFT VITS with AutoVocoder MB iSTFT VITS with AutoVocoder VIT帶有AutoVocoder源代碼下載

下載

MB-istft-fit-vits帶有自動編碼器

從VIT開始，MB-ISTFT-VIT使用以下技術提高了合成速度：

基於這個精心設計的框架，該存儲庫旨在通過AutovoCoder進一步提高聲音質量和推理速度。
此存儲庫基於MB-ISTFT-VIT，預期的修改和增強如下：

由於VIT的性質對強大的潛伏期進行了建模，因此由於其自動編碼器體系結構，AutovoCoder可以是適當的應用。此外，它具有通過(1024, 256, 1024) FFT/HOP/WIN大小直接生成波形，而無需UPSMPLING模塊，它具有快速的推理速度。（將保持多頻段的啟動）
傳統的TTS模型在內，包括VIT，建模階段信息完全是解碼器（Vocoder）的作用。在Mod 3.中，通過向潛在的提供相位信息，我們測試了先驗是否可以可靠地大約這些潛在。

Disclaimer : This repo is built for testing purpose. Performance is not guaranteed. Welcome your contributions.

python> = 3.6
克隆這個存儲庫
安裝Python要求。請參閱要求
1. 您可能需要先安裝ESPEAK： apt-get install espeak
下載數據集
1. 下載並提取LJ語音數據集，然後重命名或創建指向數據集文件夾的鏈接： ln -s /path/to/LJSpeech-1.1/wavs DUMMY1
如果您使用自己的數據集，則構建單調對齊搜索並進行預處理。

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
mkdir monotonic_align
python setup.py build_ext --inplace

在MB-ISTFT-VITS培訓的情況下，請運行以下腳本

python train_latest.py -c configs/ljs_mb_istft_vits.json -m ljs_mb_istft_vits

訓練後，您可以使用temperion.ipynb檢查推理音頻

展開

附加信息

相關應用

爲您推薦

相關資訊全部