AiVoiceダウンロード-Aivoice AiVoiceコードのダウンロード

AiVoice

AI ソースコード

1.0.0

ダウンロード

深い声3

これは、深い音声3：2000スピーカーのニューラルテキストのテキストからスピーチのTensorflow実装です。今のところ、単一のスピーカー合成に焦点を当てています。

要件

Tensorflow> = 1.2
Python> = 3.0

データセット

LJ音声データセット

前処理

LJスピーチデータセットをダウンロードして解凍します。走る：

 python prepro.py

注：データセットをprepro.pyの同じフォーラーに解凍したことを確認してください。

この後、3つの新しいフォルダーを取得します。

 ├── dones          [New]
├── mags           [New]
├── mels           [New]
├── metadata.csv
├── README
└── wavs

トレーニング

./LJSpeech-1.0/magsデータは./LJSpeech-1.0/metadata.csvからロードさ./LJSpeech-1.0/mels ./LJSpeech-1.0/dones 。ローディングパスを変更したい場合は、 class Hyperparamsの構成を変更できます。

モデルをトレーニングするには、このコマンドを使用します。

 python train.py

事前に訓練されたモデル

現在、良い結果を得ることができません。ただし、誰かがそれに興味を持っている場合に備えて、事前に訓練されたモデルを提供しています。

事前に訓練されたモデル。

その注意図は次のとおりです。

トレーニングで生成されたすべての注意数値は、事前に訓練されたモデルのziptipファイルに含まれています。

ファイルの説明

HyperParams.py：ハイパーパラメーター
pretro.py：入力とターゲット、すなわち、MELスペクトログラム、マグニチュード、およびドーンを作成します。
data_load.py
Utils.py：いくつかのカスタム運用機能。
modules.py：ネットワークのビルディングブロック。
networks.py：エンコーダー、デコーダー、およびコンバーター
Train.py：電車
Synthesize.py：推論
test_sents.txt：論文のいくつかのテスト文。

参照

コードのほとんどは、Kyubyong/deepvoice3から借用されています。

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-20
サイズ 19.32KB
から Github

AiVoice

深い声3

要件

データセット

前処理

トレーニング

事前に訓練されたモデル

ファイルの説明

参照

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express