XphoneBert_Vits2 unduh - XphoneBert_Vits2 download kode sumber

XphoneBert_Vits2

Kode Sumber AI

1.0.0

Unduh

Vits2 diperpanjang dengan encoder xphone

Kredit

Repo ini berdasarkan karya hebat Repo Vits2 dan XphoneBert.

Prasyarat

Python> = 3.10
Diuji pada Pytorch versi 1.13.1 dengan Google Colab dan Lambdalabs Cloud.
Kloning repositori ini
Pasang persyaratan Python. Silakan merujuk persyaratan.txt
Unduh set data
1. Unduh dan Ekstrak Dataset Pidato LJ, lalu ganti nama atau buat tautan ke folder Dataset: ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. Catatan: Repo ini tidak mendukung pelatihan Dataset Multi-Speaker
Pindahkan/Salin Pelatihan .txt, validasi, dan uji file Anda ke direktori FileLists, dan kemudian jalankan file preprocess.py (mirip dengan yang dijalankan untuk dataset LJSPEECH), misalnya:
- Silakan merujuk ke XphoneBert untuk informasi lebih lanjut. Mereka menggunakan text2phonemesequence untuk mengubah teks mentah menjadi urutan fonem.
- Menginisialisasi text2phonemesequence untuk setiap bahasa membutuhkan kode ISO 639-3 yang sesuai. Kode ISO 639-3 dari bahasa yang didukung tersedia di sini.
- text2phonemesequence mengambil urutan yang disegmentasi kata sebagai input. Dan pengguna juga dapat melakukan normalisasi teks pada urutan yang disegmentasi kata sebelum dimasukkan ke dalam text2phonemesequence .

Catatan: Untuk bahasa seperti bahasa Cina, Korea, Jepang (bahasa CJK) dan beberapa bahasa Asia Tenggara, kata -kata tidak dipisahkan oleh ruang. Tokenizer eksternal harus digunakan sebelum memasukkan kata -kata ke dalam model ini. Dalam hal ini, tulis skrip untuk menormalkan dan segmen input Anda sebelum memberi makan ke text2phonemesequence (vie_preprocess.py ada dalam kasus saya)

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

Bangun pencarian penyelarasan monotonik dan jalankan preprocessing jika Anda menggunakan set data Anda sendiri.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

Contoh pelatihan

Info lebih lanjut tentang konfigurasi merujuk ke configs/config.json

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-22
ukuran 24.62MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Anjing_Rubah_Kelinci

2022-08-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua