Unduh One Click VITS Training - Unduh Kode Sumber One Click VITS Training

One Click VITS Training

Kode Sumber AI

1.0.0

Unduh

Pelatihan satu klik-vits

Alat ini memungkinkan Anda untuk menyelesaikan seluruh proses VIT (preprocessing data + Whisper ASR + teks preprocessing + modifikasi config.json + pelatihan, inferensi) dengan satu klik!

Daftar isi

Struktur
Prasyarat
Instalasi
Persiapan_datasets
Penggunaan
Kesimpulan
Perubahan
Referensi

Struktur

Output sampel

Prasyarat

Sistem Windows/Linux dengan RAM minimal 16GB .
GPU dengan setidaknya 12GB VRAM.
Python == 3.8
Anaconda terpasang.
Pytorch terpasang.
Cuda 11.x terpasang.
Zlib dll terpasang.

Pytorch Install Command:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

CUDA 11.7 Instal: https://developer.nvidia.com/cuda-11-7-0-download-archive

Zlib dll instal: https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows

Instal Pyopenjtalk secara manual: pip install -U pyopenjtalk --no-build-isolation

Instalasi

Buat lingkungan Anaconda:

conda create -n one-click-vits python=3.8

Aktifkan lingkungan:

conda activate one-click-vits

Kloning repositori ini ke mesin lokal Anda:

git clone https://github.com/ORI-Muchim/One-Click-VITS-Training.git

Arahkan ke direktori yang dikloning:

 cd One-Click-VITS-Training

Instal dependensi yang diperlukan:

pip install -r requirements.txt

Persiapan_datasets

Tempatkan file audio sebagai berikut.

file .mp3 atau .wav baik -baik saja.

 One-Click-VITS-Training
├────datasets
│       ├───speaker0
│       │   ├────1.mp3
│       │   └────1.wav
│       └───speaker1
│       │    ├───1.mp3
│       │    └───1.wav
│       ├integral.py
│       └integral_low.py
│
├────vits
├────inference.py
├────main_low.py
├────main_resume.py
├────main.py
├────Readme.md
└────requirements.txt

Ini hanya sebuah contoh, dan tidak apa -apa untuk menambahkan lebih banyak speaker.

Penggunaan

Untuk memulai alat ini, gunakan perintah berikut, ganti {bahasa}, {model_name}, dan {sample_rate} dengan nilai masing -masing ({bahasa: ko, ja, en, zh} / {sample_rate: 22050 /44100}):

python main.py {language} {model_name} {sample_rate}

Bagi mereka yang memiliki spesifikasi rendah (VRAM <12GB), silakan gunakan kode ini:

python main_low.py {language} {model_name} {sample_rate}

Jika konfigurasi data selesai dan Anda ingin melanjutkan pelatihan, masukkan kode ini:

python main_resume.py {model_name}

Kesimpulan

Setelah model dilatih, Anda dapat menghasilkan prediksi dengan menggunakan perintah berikut, mengganti {model_name} dan {model_step} dengan nilai masing -masing:

python inference.py {model_name} {model_step}

Atau periksa ./vits/inference.ipynb.

Jika Anda ingin mengubah contoh teks yang digunakan dalam referensi, ubah ./vits/inferencems.py bagian text .

Perubahan

Dalam repositori cjangcjengh/vits, saya membuat beberapa modifikasi pada metode pembersihan teks Korea. Proses pembersihan lainnya adalah sama dengan mempostingnya ke repositori Cjangcjengh, tetapi file yang lebih bersih dimodifikasi menggunakan pustaka Tenebo/G2PK2 seperti yang diucapkan Korea.