XphoneBert_Vits2ダウンロードXphoneBert_Vits2ソースコードダウンロード

XphoneBert_Vits2

AI ソースコード

1.0.0

ダウンロード

vits2はxphonebertエンコーダーで拡張されました

クレジット

Vits2 RepoとXphonebertの優れた作品に基づいたこのリポジトリ。

前提条件

Python> = 3.10
Pytorchバージョン1.13.1でGoogle ColabおよびLambdalabs Cloudでテストしました。
このリポジトリをクローンします
Python要件をインストールします。要件を参照してください。txt
データセットをダウンロードします
1. LJ Speech Datasetをダウンロードして抽出し、データセットフォルダーへのリンクを変更または作成します： ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. 注：このレポは、トレーニングマルチスピーカーデータセットをサポートしていません
.txtトレーニング、検証、テストファイルをFilelistsディレクトリに移動/コピーしてから、preprocess.pyファイル（ljspeechデータセットの実行と同様）を実行します。たとえば
- 詳細については、Xphonebertを参照してください。彼らは、生のテキストを音素シーケンスに変換するためにtext2phonemesequenceを使用しています。
- 各言語のtext2phonemesequenceの初期化には、対応するISO 639-3コードが必要です。サポートされている言語のISO 639-3コードはこちらで入手できます。
- text2phonemesequence 、単語セグメント化されたシーケンスを入力として取得します。また、ユーザーは、 text2phonemesequenceにフィードを付ける前に、単語セグメント化されたシーケンスでテキスト正規化を実行する場合があります。

注：中国語、韓国語、日本語（CJK言語）、いくつかの東南アジア語などの言語については、単語は空間で区切られていません。このモデルに単語を供給する前に、外部トークン剤を使用する必要があります。この場合、 text2phonemesequenceにフィードを与える前に入力を正規化およびセグメント化するスクリプトを書きます（vie_preprocess.pyは私の場合です）

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

独自のデータセットを使用する場合は、単調アライメント検索を構築し、プリプロセシングを実行します。

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

トレーニングの例

configの詳細についてはconfigs/config.jsonを参照してください

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-08-22
サイズ 24.62MB
から Github

XphoneBert_Vits2

vits2はxphonebertエンコーダーで拡張されました

クレジット

前提条件

トレーニングの例

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

nextcloud_share_url_downloader

犬キツネバニー

Lihua データ分析エンジン無料版 3.0_検索_ナビゲーション_コレクション_世論_ランキング_api

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express