tacotron2 tts GUI下载tacotron2 tts GUI源代码下载

tacotron2 tts GUI

Ai源码

[Windows] GUI Portable executable (CPU only)

下载

GUI正在进行的工作（2020年8月4日更新）

GUI包装器合成。允许仅通过可切换开关综合CPU合成。便携式EXE文件可用（仅在CPU上运行）。

还播放来自流元素的TTS捐赠警报。

主UI	流元素集成

概述

具有用户友好的GUI的基于机器学习的文本。目标受众包括抽水机或内容创建者寻找开源TTS程序。该软件的目的是使Portable EXE中的TTS综合离线（无编码体验，GPU/COLAB）。

特征

自动读取流元素的捐赠
NVIDIA /TACOTRON2和 /WAVEGLOW的PYQT5包装器

下载链接

可以在发布页面或直接在此处找到便携式可执行文件。从下面下载预验证的Tacotron 2和Wavellow模型。

警告：便携式可执行文件在CPU上运行，与在GPU上运行相比，它导致> 10倍速度降低。

从来源建造

要求

Python> = 3.7
天秤座
numpy
pyqt5 == 5.15.0
请求
TQDM
matplotlib
Scipy
num2words
pygame

Pytorch 1.0

运行

 python gui.py

执照

NVIDIA/TACOTRON2和WAVEGLOW：BSD-3-CLAUSE许可证

笔记

NVIDIA/TACOTRON2的TTS代码
https://github.com/corentinj/realtim-voice-cloning from https://github.com/corentinj https：/realstreamer的forsen tts https://www.youtube.com/watch?v=kl2tglbbccdco？

原始仓库：

TACOTRON 2（无象文化）

通过在MEL频谱图预测上调节Waveet，对天然TT合成的Pytorch实现。

该实现包括分布式和自动混合精度支持，并使用LJSpeech数据集。

分布式和自动混合精度支持取决于NVIDIA的顶点和AMP。

使用我们已发表的Tacotron 2和Wavellow模型访问我们的网站以获取音频样本。

对齐，预测的MEL光谱图，目标MEL光谱图

先决条件

nvidia gpu + cuda cudnn

设置

下载并提取LJ语音数据集
克隆此仓库： git clone https://github.com/NVIDIA/tacotron2.git
CD进入此存储库： cd tacotron2
初始化subsodule： git submodule init; git submodule update
更新.wav路径： sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- 另外，设置load_mel_from_disk=True in hparams.py和更新mel-spectragram路径
安装Pytorch 1.0
安装顶点
安装Python要求或构建Docker Image
- 安装Python要求： pip install -r requirements.txt

训练

python train.py --output_directory=outdir --log_directory=logdir
（可选） tensorboard --logdir=outdir/logdir

使用预训练的模型培训

使用预训练的模型训练可能会导致默认情况下更快地收敛，数据集依赖的文本嵌入层被忽略

下载我们已发布的Tacotron 2模型
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

多GPU（分布式）和自动混合精度训练

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

推理演示

下载我们已发布的Tacotron 2模型
下载我们已发表的Wavellow模型
jupyter notebook --ip=127.0.0.1 --port=31337
加载推理。IPYNB

NB执行MEL光谱图与音频合成时，请确保对Tacotron 2和MEL解释器进行相同的MEL光谱图表示。

致谢

该实现使用以下存储库中的代码：Keith Ito，Prem Seetharaman，如我们的代码中所述。

我们的灵感来自Yamamoto Ryuchi的Tacotron Pytorch实施。

我们感谢Tacotron 2纸作者，特别是Jonathan Shen，Yuxuan Wang和Zongheng Yang。

展开

附加信息

版本 [Windows] GUI Portable executable (CPU only)
类型 Ai源码
更新时间 2025-08-24
大小 1.13MB
来自于 Github

tacotron2 tts GUI

GUI正在进行的工作（2020年8月4日更新）

概述

特征

下载链接

从来源建造

要求

运行

执照

笔记

原始仓库：

TACOTRON 2（无象文化）

先决条件

设置

训练

使用预训练的模型培训

多GPU（分布式）和自动混合精度训练

推理演示

相关存储库

致谢

PPPwn Tinker GUI

Anime batch downloader gui

GitHub sgrebnov/cordova plugin background download

Demucs Gui

F5 TTS ComfyUI

语音开发英文资料(TTS使用指南Delphi版)

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express