FastSpeech2下載FastSpeech2源代碼下載

FastSpeech2

Ai源碼

1.0.0

下載

FastSpeech 2

FastSpeech的非正式Pytorch實施2：快速和高質量的端到端文本到語音。此存儲庫將ESPNET的快速實現作為基礎。在此實施中，我試圖複製確切的紙張詳細信息，但仍然需要進行一些更好的模型，此存儲庫為任何建議和改進而開放。該倉庫使用NVIDIA的TACOTRON 2預處理進行音頻預處理，將梅爾根（Melgan）作為Vocoder。

演示：

要求：

所有代碼以Python 3.6.2編寫。

安裝Pytorch

在安裝Pytorch之前，請通過運行以下命令來檢查您的CUDA版本： nvcc --version

 pip install torch torchvision

在此存儲庫中，我使用了pytorch 1.6.0用於torch.bucketize功能，這在pytorch的先前版本中不存在。

安裝其他要求：

 pip install -r requirements.txt

使用張量板安裝tensorboard version 1.14.0分別使用受支持的tensorflow (1.14.0)

用於預處理：

filelists文件夾包含MFA（Motreal Force Aligner）處理的LJSpeech數據集文件，因此您無需將文本與LJSpeech數據集的音頻（用於提取持續時間）對齊。對於其他數據集，請在此處遵循指令。對於其他預處理運行以下命令：

 python .nvidia_preprocessing.py -d path_of_wavs

查找F0和能量的最小和最大

 python .compute_statistics.py

在hparams.py中更新以下內容，按min和最大的f0和能量更新

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

進行培訓

 python train_fastspeech.py --outdir etc -c configs/default.yaml -n "name"

進行推斷

目前僅支持基於音素的合成。

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1ts_version2_fastspeech_fe9a2c7_7k_steps.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

對於Torchscript導出

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

檢查點和样本：

檢查點在此處找到
對於樣品檢查sample文件夾。

張板

訓練：

驗證：

筆記

此存儲庫的編碼大致只是為了重新生產紙張和實驗目的。需要進行代碼清理和阿片化以更好地使用。
目前，此存儲庫會產生高質量的音頻，但仍處於WIP中，需要進行許多改進。
F0的損耗曲線很高。
我正在使用RAW F0和能量進行訓練A模型，但是我們也可以將歸一化的F0和能量用於穩定訓練。
使用Postnet提高音頻質量。
有關更完整和端到的語音克隆或文本到語音（TTS）工具箱⚡請訪問DeepSync Technologies。

參考

FastSpeech 2：快速和高質量的端到端文本到語音
FastSpeech：快速，健壯且可控制的文本到語音
ESPNET
NVIDIA的Wavellow實現
梅爾根
榴蓮
FastSpeech2 TensorFlow實現
其他Pytorch FastSpeech 2實現
Wavernn

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-08-20
大小 6.06MB
來自於 Github

相關應用

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部

FastSpeech2