Akustik-fastspeech2 (khusus)
Kinerja yang wajar dengan memanfaatkan pembelajaran transfer untuk personalisasi dengan sejumlah kecil data
Menyediakan API yang dapat dibuat dengan fine-tune dalam kumpulan data Korea secara real time
Modifikasi kode model menurut fine-tune
Preprocess mudah, kereta api, sintesis melalui skrip shell
Berikan gambar Docker yang unik
Ini cocok dengan nama file FastSpeech2 dan HiFi-Gan pra-terlatih CKPT dan menyimpannya di setiap model.
(FastSpeech2: 30.000 Langkah Pembelajaran / HiFi -Gan -Jungil King's Resmi Pretated -University -University)
Untuk belajar dan sintesis, kami memuat dan menjalankan gambar Docker yang berisi semua paket dependen.
docker pull hws0120/e2e_speech_synthesis
Langkah -langkah run_fs2_preprocessing.sh terhubung ke Docker dengan perintah conda dan menginstal paket python jamo.
conda activate aligner
pip install jamo
Akhir lingkungan virtual untuk melakukan run_fs2_train atau sintesis.
conda activate base
Jika Anda memenuhi semua item di atas, jalankan skrip shell untuk mengekstrak MFA.
sh run_FS2_preprocessing.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
Berhasil membuat TextGrid untuk keluar dari lingkungan virtual dan menjalankan skrip pembelajaran.
sh run_FS2_train.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
Ketika FastSpeech2 5000 Step Learning selesai, jalankan skrip HIFI-GAN.
sh run_HiFi-GAN_train.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
Ketika model yang dipelajari di folder CKPT siap, jalankan skrip untuk sintesis.
sh run_FS2_synthesize.sh
# Enter the dataset name
[Dataset_Name](ex. HW)
Setiap wadah ditetapkan dalam proses pembelajaran dan sintesis dan proses seperti yang ditunjukkan.
Jika Anda memiliki pos pemeriksaan HIFI-GAN yang sesuai, Anda dapat menghilangkan pembelajaran HiFi-Gan.