tacotron2 tts GUI下載tacotron2 tts GUI源代碼下載

中文(繁体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首頁>編程相關>Ai源碼

tacotron2 tts GUI

Ai源碼

[Windows] GUI Portable executable (CPU only)

下載

GUI正在進行的工作（2020年8月4日更新）

GUI包裝器合成。允許僅通過可切換開關綜合CPU合成。便攜式EXE文件可用（僅在CPU上運行）。

還播放來自流元素的TTS捐贈警報。

主UI	流元素集成

概述

具有用戶友好的GUI的基於機器學習的文本。目標受眾包括抽水機或內容創建者尋找開源TTS程序。該軟件的目的是使Portable EXE中的TTS綜合離線（無編碼體驗，GPU/COLAB）。

特徵

自動讀取流元素的捐贈
NVIDIA /TACOTRON2和 /WAVEGLOW的PYQT5包裝器

下載鏈接

可以在發布頁面或直接在此處找到便攜式可執行文件。從下面下載預驗證的Tacotron 2和Wavellow模型。

警告：便攜式可執行文件在CPU上運行，與在GPU上運行相比，它導致> 10倍速度降低。

從來源建造

要求

Python> = 3.7
天秤座
numpy
pyqt5 == 5.15.0
請求
TQDM
matplotlib
Scipy
num2words
pygame

Pytorch 1.0

運行

 python gui.py

執照

NVIDIA/TACOTRON2和WAVEGLOW：BSD-3-CLAUSE許可證

筆記

NVIDIA/TACOTRON2的TTS代碼
https://github.com/corentinj/realtim-voice-cloning from https://github.com/corentinj https：/realstreamer的forsen tts https://www.youtube.com/watch?v=kl2tglbbccdco？

原始倉庫：

TACOTRON 2（無象文化）

通過在MEL頻譜圖預測上調節Waveet，對天然TT合成的Pytorch實現。

該實現包括分佈式和自動混合精度支持，並使用LJSpeech數據集。

分佈式和自動混合精度支持取決於NVIDIA的頂點和AMP。

使用我們已發表的Tacotron 2和Wavellow模型訪問我們的網站以獲取音頻樣本。

對齊，預測的MEL光譜圖，目標MEL光譜圖

先決條件

nvidia gpu + cuda cudnn

設定

下載並提取LJ語音數據集
克隆此倉庫： git clone https://github.com/NVIDIA/tacotron2.git
CD進入此存儲庫： cd tacotron2
初始化subsodule： git submodule init; git submodule update
更新.wav路徑： sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- 另外，設置load_mel_from_disk=True in hparams.py和更新mel-spectragram路徑
安裝Pytorch 1.0
安裝頂點
安裝Python要求或構建Docker Image
- 安裝Python要求： pip install -r requirements.txt

訓練

python train.py --output_directory=outdir --log_directory=logdir
（可選） tensorboard --logdir=outdir/logdir

使用預訓練的模型培訓

使用預訓練的模型訓練可能會導致默認情況下更快地收斂，數據集依賴的文本嵌入層被忽略

下載我們已發布的Tacotron 2模型
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

多GPU（分佈式）和自動混合精度訓練

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

推理演示

下載我們已發布的Tacotron 2模型
下載我們已發表的Wavellow模型
jupyter notebook --ip=127.0.0.1 --port=31337
加載推理。 IPYNB

NB執行MEL光譜圖與音頻合成時，請確保對Tacotron 2和MEL解釋器進行相同的MEL光譜圖表示。

相關存儲庫

波格綜合的速度比實時流量的生成網絡快速綜合語音綜合

NV-Wavenet的速度比實時磁帶快。

致謝

該實現使用以下存儲庫中的代碼：Keith Ito，Prem Seetharaman，如我們的代碼中所述。

我們的靈感來自Yamamoto Ryuchi的Tacotron Pytorch實施。

我們感謝Tacotron 2紙作者，特別是Jonathan Shen，Yuxuan Wang和Zongheng Yang。

展開

附加信息

版本 [Windows] GUI Portable executable (CPU only)
類型 Ai源碼
更新時間 2025-08-24
大小 1.13MB
來自於 Github

相關應用

PPPwn Tinker GUI

2024-11-10
Anime batch downloader gui

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Demucs Gui

2024-11-03
F5 TTS ComfyUI

2024-11-02
語音開發英文資料(TTS使用指南Delphi版)

2009-05-28

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部