Text to Speech Landscape
1.0.0
| サンプル | 前処理されたモデル | コード | 紙 | 出力品質 |
|---|---|---|---|---|
| Baiduの深い声のサンプル(公式) | - | - | - | d |
| BaiduのDeep Voice 3サンプル(公式) | - | - | 1710.07654 | b |
| GoogleTacotron2サンプル(公式) | - | - | 1712.05884 | a |
| Google Tacotron +スタイル転送サンプル(公式) | - | - | 1803.09047 | a |
| Nvidiaの波動 | モデルをダウンロードします | コード | 1811.00002 | a |
| NvidiaのTacotron2 +波動 | モデルをダウンロードします | コード | - | a |
| グリフィン・リム | - | - | - | a |
| ディープマインドニューラル離散表現学習サンプル(公式) | - | - | 1711.00937 | b |
| R9Y9のWavenet Vocoder Tacotron2(189k Iterations) | (Tacotron2モデルをダウンロード) - (Wavenet Model(1000K Iterations)) - (Modelを取得) | - | 1712.05884および1611.09482 | b |
| DHGRSの神経離散表現学習サンプルの実装 | モデルをダウンロードします | コード | 1711.00937 | d |
| MazzzystarのTacotron-Wavernnサンプル(730k反復) | モデルを取得します | コード | - | a |
| Syang1993のタコトロン +スタイル転送サンプル(200k反復) | モデルernsttmp(232k iter) | - | 1803.09047および1803.09017 | c |
| Keithitoのタコトロンサンプル(414kの反復) | モデルを取得します | - | - | d |
| RayhaneのTacotron2サンプル(6k4ステップ(それが意味するものは何でも)) | - | - | - | d |
| LJデータセットのKyubyongのタコトロン(200k反復) | モデルをダウンロードします | - | - | d |
| ニックデータセットのkyubyongのタコトロン(215k反復) | - | - | - | d |
| KyubyongのWebデータセット上のタコトロン(183k反復) | モデルをダウンロードします | - | - | d |
| Kyubyongの表現力豊かなタコトロン(420K反復) | - | コード | 1803.09047 | d |
| LJデータセット上のKyubyongのDC-TTS(800Kイテレーション) | モデルを取得します | - | - | d |
| Nick DatasetのKyubyongのDC-TTS(800K反復) | - | - | - | d |
| KyubyongのDC-TTS Kate(800K Iterations) | - | - | - | d |
| Andabiの深い声の変換 | - | - | - | d |
| Facebookループサンプル(公式) | モデルを取得します | - | - | d |
| Mazzzystarのランダムな音声転送 | - | - | 1712.08363 | d |
この統合で出力サンプル/デモを逃した場合は、プルリクエストを追加して送信するだけです。私はそれを追加して幸せになります。ありがとう!
あなたが良い仕事を続けたいならば、私たちをサポートしてください