TTS Tacotron Pytorch下載TTS Tacotron Pytorch源代碼下載

TTS Tacotron Pytorch

Ai源碼

1.0.0

下載

TACOTRON

Google的Tacotron語音合成網絡的Pytorch實現。

該實現還包括對位置敏感的關注以及Tacotron 2的停止令牌功能。

此外，使用訓練的模型在LJ語音數據集上進行了培訓。

可以在結果目錄中找到音頻樣本。

介紹

該實現基於R9Y9/Tacotron_pytorch，主要區別是：

增加了對位置敏感的關注，並從TaCotron 2紙上的停止令牌。這可以大大減少培訓模型所需的時間和數據。
刪除R9Y9使用的所有TensorFlow依賴性，現在僅在Pytorch和Pytorch上運行。
添加一個損失模塊，並使用L2（MSE）損失而不是L1損失。
添加了一個數據加載器模塊。
合併Keithito的LJ語音數據預處理腳本。
代碼分解和優化，以便於調試和擴展。

此外，與原始的Tacotron紙有一些差異是：

預測每個解碼器步驟，而不是r = 2，預測r = 5個非重疊的連續式外幀。
將所有R幀饋送到下一個解碼器輸入步驟，而不僅僅是R幀的最後幀。
縮放預測線性光譜圖上的損失，以使與人類語音（0至3000 Hz）相對應的較低頻率重量更大。
沒有在序列到序列學習中使用損失面具，這迫使模型學習何時停止合成。
禁用CBHG模塊中的一維卷積單元的偏差。這些實現細節有助於模型的收斂。

音頻質量還不如Google的演示，但希望最終會有所改善。歡迎拉動請求！

快速開始

設定

克隆此倉庫： git clone [email protected]:andi611/Tacotron-Pytorch.git
CD進入此存儲庫： cd Tacotron-Pytorch

安裝依賴項

安裝Python 3。
根據您的平台安裝最新版本的Pytorch 。為了獲得更好的性能，請在可行的情況下使用GPU支持（CUDA）安裝。該代碼可與Pytorch 0.4及更高版本一起使用。
安裝要求：
```
 pip3 install -r requirements.txt
```
警告：您需要根據平台安裝火炬。這裡列出構建此項目時使用的Pytorch版本。

訓練

下載LJ語音數據集。
- LJ演講
如果將其他數據集轉換為正確的格式，則可以使用其他數據集。有關更多信息，請參見triaze_data.md。
將數據集解開為~/Tacotron-Pytorch/data data
解開包裝後，您的樹應該像這樣的LJ演講：
```
 |- Tacotron-Pytorch
	 |- data
		 |- LJSpeech-1.1
			 |- metadata.csv
			 |- wavs
```

預處理LJ語音數據集，並使用Preprocess.py製作模型的元文件：

 python3 preprocess.py --mode make

預處理後，您的樹看起來像這樣：

 |- Tacotron-Pytorch
	 |- data
		 |- LJSpeech-1.1 (The downloaded dataset)
			 |- metadata.csv
			 |- wavs
		 |- meta (generate by preprocessing)
			 |- meta_text.txt 
			 |- meta_mel_xxxxx.npy ...
			 |- meta_spec_xxxxx.npy ...
		 |- test_transcripts.txt (provided)

使用train.py訓練模型
```
 python3 train.py --ckpt_dir ckpt/ --log_dir log/
```
從以前的檢查站恢復培訓：
```
 python3 train.py --ckpt_dir ckpt/ --log_dir log/ --model_name 500000
```
可調超參數可在config.py中找到。
您可以通過編輯文件來調整這些參數並設置設置，建議使用默認的超參數用於LJ語音。
用張板監視（可選）
```
 tensorboard --logdir 'path to log_dir'
```
培訓師默認情況下每2000個步驟一次傾倒音頻和對齊。您可以在tacotron/ckpt/中找到這些。

測試：使用預訓練的模型和Test.py

以交互式模式運行測試環境：

 python3 test.py --interactive --plot --model_name 500000

在一組成績單上運行測試算法（結果可以在結果/500000目錄中找到）：

 python3 test.py --plot --model_name 500000 --test_file_path ./data/test_transcripts.txt

致謝

Yamamoto Ryuichi的歸功於Tacotron的出色pytorch實施，這項工作主要基於。這項工作還受到NVIDIA的Tacotron 2 Pytorch實施的啟發。

托多

添加更多可配置的HPARAMS

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-08-21
大小 81.78MB
來自於 Github

相關應用

GitHub sgrebnov/cordova plugin background download

2024-11-05
pytorch image models

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
語音開發英文資料(TTS使用指南Delphi版)

2009-05-28

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部