MultiSpeechダウンロード - MultiSpeechチソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

MultiSpeech

AI ソースコード

1.0.0

ダウンロード

多音声

これはマルチスピーチのPytorch実装です：トランスを使用したマルチスピーカーテキストからスピーチへ

モデル

データをトレーニングします

データでモデルをトレーニングするために、以下の手順に従ってください

1。データ前処理

データを準備し、ヘッダーなしで以下のようにデータがPSV形式でフォーマットされていることを確認してください

 speaker_id,audio_path,text,duration
0|file/to/file.wav|the text in that file|3.2

スピーカーIDは整数である必要があり、0から始まります

この状態を満たすために適切な変換を行わない場合は、オーディオがモノであることを確認してください

2。開発環境のセットアップ

環境を作成します

python -m venv env

環境をアクティブにします

 source env/bin/activate

必要な依存関係をインストールします

pip install -r requirements.txt

3。トレーニング

必要に応じて構成ファイルを更新します

モデルをトレーニングします

python train.py --train_path train_data.txt --test_path test_data.txt --checkpoint_dir outdir --epoch 100 --batch_size 64

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-21
サイズ 19.25KB
から Github

関連アプリ

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
ML stack

AI ソースコード

1.0.0
awesome free chatgpt

AI ソースコード

1.0.0
pywin_contextmenu

AI ソースコード

Version update
Google Dorks

その他のソースコード

1.0
shepherd

その他のソースコード

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

その他のソースコード

v1.1.0-rc-3

関連情報すべて