tacotron2 tts GUI
[Windows] GUI Portable executable (CPU only)
GUI包装器合成。允许仅通过可切换开关综合CPU合成。便携式EXE文件可用(仅在CPU上运行)。
还播放来自流元素的TTS捐赠警报。
| 主UI | 流元素集成 |
|---|---|
具有用户友好的GUI的基于机器学习的文本。目标受众包括抽水机或内容创建者寻找开源TTS程序。该软件的目的是使Portable EXE中的TTS综合离线(无编码体验,GPU/COLAB)。
可以在发布页面或直接在此处找到便携式可执行文件。从下面下载预验证的Tacotron 2和Wavellow模型。
警告:便携式可执行文件在CPU上运行,与在GPU上运行相比,它导致> 10倍速度降低。
Pytorch 1.0
python gui.py
通过在MEL频谱图预测上调节Waveet,对天然TT合成的Pytorch实现。
该实现包括分布式和自动混合精度支持,并使用LJSpeech数据集。
分布式和自动混合精度支持取决于NVIDIA的顶点和AMP。
使用我们已发表的Tacotron 2和Wavellow模型访问我们的网站以获取音频样本。

git clone https://github.com/NVIDIA/tacotron2.gitcd tacotron2git submodule init; git submodule updatesed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txtload_mel_from_disk=True in hparams.py和更新mel-spectragram路径pip install -r requirements.txt python train.py --output_directory=outdir --log_directory=logdirtensorboard --logdir=outdir/logdir 使用预训练的模型训练可能会导致默认情况下更快地收敛,数据集依赖的文本嵌入层被忽略
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True jupyter notebook --ip=127.0.0.1 --port=31337NB执行MEL光谱图与音频合成时,请确保对Tacotron 2和MEL解释器进行相同的MEL光谱图表示。
波格综合的速度比实时流量的生成网络快速综合语音综合
NV-Wavenet的速度比实时磁带快。
该实现使用以下存储库中的代码:Keith Ito,Prem Seetharaman,如我们的代码中所述。
我们的灵感来自Yamamoto Ryuchi的Tacotron Pytorch实施。
我们感谢Tacotron 2纸作者,特别是Jonathan Shen,Yuxuan Wang和Zongheng Yang。