dctts pytorchダウンロードdctts pytorchソースコードのダウンロード

dctts pytorch

AI ソースコード

1.0.0

ダウンロード

DC-TTS

PaparのPytorchの実装は、誘導された注意を払った深い畳み込みネットワークに基づいて、効率的にトレーニング可能なテキストからスピーチへの実装システムを実装しています。

kyubyong/dc_ttsに感謝します。

データセット

LJ音声データセット。 1人の女性スピーカーの13,100の短いオーディオクリップで構成されるパブリックドメインの音声データセット。

電車

ハイパーパラメーターを調整し、LJの音声データセットでモデルをトレーニングしました。ハイパーパラメーターは最良ではなく、元の紙で使用されているものとわずかに異なっています。

LJスピーチデータセットで自分でモデルをトレーニングするには：

データセットをダウンロードしてディレクトリに抽出し、 pkg/hyper.pyでディレクトリを設定します
プリプロセスを実行します
```
 python3 main.py --action preprocess
```
text2melネットワークのトレーニングデバイスを変更して、 pkg/hyper.pyでtext2melをトレーニングできます
```
 python3 main.py --action train --module Text2Mel
```
SSRNネットワークをトレーニングすることも、トレーニングデバイスを変更することができます
```
 python3 main.py --action train --module SuperRes
```

サンプル

一部の合成サンプルは、ディレクトリsynthesisに含まれています。文章は、 sentences.txtにリストされています。 Text2MelとSuperresの事前に訓練されたモデル（ logdir/text2mel/pkg/trained.pkgおよびlogdir/superres/pkg/trained.pkg ）は、合成時にロードされます。

sentences.txtにリストされているサンプルを合成できます