FastSpeech2下载FastSpeech2源代码下载

FastSpeech2

Ai源码

1.0.0

下载

FastSpeech 2

FastSpeech的非正式Pytorch实施2：快速和高质量的端到端文本到语音。此存储库将ESPNET的快速实现作为基础。在此实施中，我试图复制确切的纸张详细信息，但仍然需要进行一些更好的模型，此存储库为任何建议和改进而开放。该仓库使用NVIDIA的TACOTRON 2预处理进行音频预处理，将梅尔根（Melgan）作为Vocoder。

演示：

要求：

所有代码以Python 3.6.2编写。

安装Pytorch

在安装Pytorch之前，请通过运行以下命令来检查您的CUDA版本： nvcc --version

 pip install torch torchvision

在此存储库中，我使用了pytorch 1.6.0用于torch.bucketize功能，这在pytorch的先前版本中不存在。

安装其他要求：

 pip install -r requirements.txt

使用张量板安装tensorboard version 1.14.0分别使用受支持的tensorflow (1.14.0)

用于预处理：

filelists文件夹包含MFA（Motreal Force Aligner）处理的LJSpeech数据集文件，因此您无需将文本与LJSpeech数据集的音频（用于提取持续时间）对齐。对于其他数据集，请在此处遵循指令。对于其他预处理运行以下命令：

 python .nvidia_preprocessing.py -d path_of_wavs

查找F0和能量的最小和最大

 python .compute_statistics.py

在hparams.py中更新以下内容，按min和最大的f0和能量更新

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

进行培训

 python train_fastspeech.py --outdir etc -c configs/default.yaml -n "name"

进行推断

目前仅支持基于音素的合成。

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1ts_version2_fastspeech_fe9a2c7_7k_steps.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

对于Torchscript导出

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

检查点和样本：

检查点在此处找到
对于样品检查sample文件夹。

张板

训练：

验证：

笔记

此存储库的编码大致只是为了重新生产纸张和实验目的。需要进行代码清理和阿片化以更好地使用。
目前，此存储库会产生高质量的音频，但仍处于WIP中，需要进行许多改进。
F0的损耗曲线很高。
我正在使用RAW F0和能量进行训练A模型，但是我们也可以将归一化的F0和能量用于稳定训练。
使用Postnet提高音频质量。
有关更完整和端到的语音克隆或文本到语音（TTS）工具箱⚡请访问DeepSync Technologies。

参考

FastSpeech 2：快速和高质量的端到端文本到语音
FastSpeech：快速，健壮且可控制的文本到语音
ESPNET
NVIDIA的Wavellow实现
梅尔根
榴莲
FastSpeech2 TensorFlow实现
其他Pytorch FastSpeech 2实现
Wavernn

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-20
大小 6.06MB
来自于 Github

FastSpeech2

FastSpeech 2

演示：

要求：

用于预处理：

进行培训

进行推断

对于Torchscript导出

检查点和样本：

张板

笔记

参考

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express

FastSpeech2

FastSpeech 2

演示：

要求 ：

用于预处理：

进行培训

进行推断

对于Torchscript导出

检查点和样本：

张板

笔记

参考

要求：