FastSpeechのダウンロードFastSpeechソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>パイソン

FastSpeech

パイソン

1.0.0

ダウンロード

fastspeech-pytorch

Pytorchに基づくFastSpeechの実装。

更新（2020/07/20）

トレーニングプロセスを最適化します。
長さレギュレータの実装を最適化します。
FastSpeech2と同じハイパーパラメーターを使用します。
1、2、3の測定により、トレーニングプロセスは以前よりも3倍高速になります。
より良い音質の品質。

モデル

私のブログ

FastSpeechの読み取りメモ
この実装の詳細と再考

データセットを準備します

ljspeechデータセットをダウンロードして抽出します。
ljspeechデータセットをdataに入れます。
unzip alignments.zip 。
Nvidiaの前処理された波動モデルをwaveglow/pretrained_modelに置き、 waveglow_256channels.ptと名前を変更します。
python3 preprocess.pyを実行します。

トレーニング

python3 train.pyを実行します。

評価

python3 eval.pyを実行します。

メモ

FastSpeechの論文では、著者は事前に訓練されたトランスTTSモデルを使用して、アライメントのターゲットを提供します。よく訓練されたトランスTTSモデルがなかったので、代わりにTacotron2を使用します。
FastSpeech2と同じハイパーパラメーターを使用しています。
オーディオの例はsampleにあります。
事前に保護されたモデル。

参照

リポジトリ

Tensorflowに基づくタコトロンの実装
Pytorchに基づくトランスの実装
Pytorchに基づくトランスTTの実装
Pytorchに基づくTacotron2の実装
Pytorchに基づくFastSpeech2の実装

紙

Tacotron2
トランス
fastspeech
fastspeech2

拡大する

追加情報

バージョン 1.0.0
タイプパイソン
更新時間 2025-07-12
サイズ 6.35MB
から Github

関連アプリ

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Redash オープンソースデータチャートツール v24.10.0

2024-11-27
datamule python

2024-11-08
スマートチャートデータ視覚化プラットフォーム v6.9

2024-11-27
Locust 負荷テストツール v2.32.0

2024-11-27

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ToDo Co

パイソン

1.0.0
Python Portfolio

パイソン
datamule python

パイソン
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて