tacotron2 tts GUIダウンロードtacotron2 tts GUIソースコードダウンロード

tacotron2 tts GUI

AI ソースコード

[Windows] GUI Portable executable (CPU only)

ダウンロード

GUI作業中の作業（2020年8月4日更新）

合成するためのGUIラッパー。トググレージスイッチを介してCPUのみの合成を許可します。ポータブルEXEファイルが利用可能です（CPUでのみ実行されます）。

また、ストリーム要素からのTTS寄付アラートもプレイします。

メインUI	ストリーム要素統合

概要

ユーザーフレンドリーなGUIを使用した機械学習ベースのテキストから音声プログラム。ターゲットオーディエンスには、オープンソースTTSプログラムを探しているTwitchストリーマーまたはコンテンツクリエイターが含まれます。このソフトウェアの目的は、TTS合成をオフラインにアクセスできるようにすることです（コーディングエクスペリエンスなし、GPU/Colab）ポータブルExeです。

特徴

ストリーム要素からの寄付を自動的に読み取ります
nvidia /tacotron2および /波動のpyqt5ラッパー

ダウンロードリンク

ポータブル実行可能ファイルは、リリースページ、または直接ここにあります。以下から、前処理されたタコトロン2と波動モデルをダウンロードしてください。

警告：ポータブル実行可能ファイルはCPUで実行され、GPUで実行するのと比較して10倍以上の速度の減速につながります。

ソースからの建物

要件

Python> = 3.7
リブーザ
numpy
pyqt5 == 5.15.0
リクエスト
TQDM
matplotlib
scipy
num2words
pygame

Pytorch 1.0

実行する

 python gui.py

ライセンス

nvidia/tacotron2＆waveglow：BSD-3-Clauseライセンス

メモ

Nvidia/Tacotron2のTTSコード
https://github.com/corentinj/real-time-voice-cloning and layoutのu/realstreamerのforsen tts https://www.youtube.com/watch？v = kl2tglbcdcoからの部分的なGUIコード

オリジナルのレポ：

タコトロン2（Wavenetなし）

MELスペクトログラム予測にWavenetを条件付けすることによる天然TTS合成のPytorch実装。

この実装には、分散型および自動混合精度サポートが含まれ、ljspeechデータセットを使用します。

分散および自動混合精密サポートは、Nvidiaの頂点とアンプに依存しています。

公開されているTacotron 2とWaveGlowモデルを使用して、オーディオサンプルについては、当社のWebサイトにアクセスしてください。

アラインメント、予測されたMELスペクトログラム、ターゲットMELスペクトログラム

前提条件

nvidia gpu + cuda cudnn

設定

LJスピーチデータセットをダウンロードして抽出します
このレポンをクローンする： git clone https://github.com/NVIDIA/tacotron2.git
このリポジトリへのCD： cd tacotron2
サブモジュールを初期化： git submodule init; git submodule update
更新.WAVパス： sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- または、 hparams.pyでload_mel_from_disk=Trueを設定し、melspectrogramパスを更新します
Pytorch 1.0をインストールします
頂点をインストールします
Python要件をインストールするか、Docker画像を作成します
- Python要件のインストール： pip install -r requirements.txt

トレーニング

python train.py --output_directory=outdir --log_directory=logdir
（オプション） tensorboard --logdir=outdir/logdir

事前に訓練されたモデルを使用したトレーニング

事前に訓練されたモデルを使用したトレーニングは、デフォルトでより速い収束につながる可能性があり、データセット依存テキストの埋め込み層は無視されます

公開されているタコトロン2モデルをダウンロードします
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

マルチGPU（分散）および自動混合精密トレーニング

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

推論デモ

公開されているタコトロン2モデルをダウンロードします
公開されているWaveglowモデルをダウンロードします
jupyter notebook --ip=127.0.0.1 --port=31337
Load Inference.ipynb

NBメルスペクトルグラムをオーディオ合成に実行するとき、タコトロン2とMELデコーダーが同じMELスペクトル表現でトレーニングされていることを確認してください。

謝辞

この実装では、次のレポのコードを使用します。KeithIto、Prem Seetharamanは、コードに記載されています。

私たちは、ヤマモトのタコトロンピトルチの実装に触発されています。

タコトロン2の紙の著者、特にジョナサン・シェン、Yuxuan Wang、Zongheng Yangに感謝しています。

拡大する

追加情報

バージョン [Windows] GUI Portable executable (CPU only)
タイプ AI ソースコード
更新時間 2025-08-24
サイズ 1.13MB
から Github

tacotron2 tts GUI

GUI作業中の作業（2020年8月4日更新）

概要

特徴

ダウンロードリンク

ソースからの建物

要件

実行する

ライセンス

メモ

オリジナルのレポ：

タコトロン2（Wavenetなし）

前提条件

設定

トレーニング

事前に訓練されたモデルを使用したトレーニング

マルチGPU（分散）および自動混合精密トレーニング

推論デモ

関連リポジトリ

謝辞

PPPwn Tinker GUI

Anime batch downloader gui

GitHub sgrebnov/cordova plugin background download

Demucs Gui

F5 TTS ComfyUI

音声開発に関する英語情報 (TTS ユーザーガイド Delphi 版)

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express