Unduh Kazakh_TTS - Unduh Kode Sumber Kazakh

Kazakh_TTS

Kode Sumber AI

1.0.0

Unduh

Resep Kazakhtts

Ini adalah resep model teks-ke-speech Kazakh berdasarkan Kazakhtts dan Kazakhtts2 Corpora.

Pengaturan dan Persyaratan

Kode kami dibangun di atas ESPNET, dan membutuhkan pemasangan kerangka kerja sebelumnya. Harap ikuti panduan instalasi dan letakkan folder Kazakhtts di dalam espnet/egs2/ Direktori:

 cd espnet/egs2
git clone https://github.com/IS2AI/Kazakh_TTS.git

Pergi ke folder Kazakh_TTS/TTS1 dan buat tautan ke dependensi:

 ln -s ../../TEMPLATE/tts1/path.sh .
ln -s ../../TEMPLATE/asr1/pyscripts .
ln -s ../../TEMPLATE/asr1/scripts .
ln -s ../../../tools/kaldi/egs/wsj/s5/steps .
ln -s ../../TEMPLATE/tts1/tts.sh .
ln -s ../../../tools/kaldi/egs/wsj/s5/utils .

Mengunduh dataset

Unduh dataset Kazakhtts dan untar di direktori pilihan Anda. Tentukan jalur ke direktori dataset (di mana Dir audio/transkrip berada) di dalam skrip KazakhTTS/tts1/local/data.sh :

 db_root=/path-to-speaker-folder

Misalnya db_root=/home/datasets/ISSAI_KazakhTTS/M1/Books

Pelatihan

Untuk melatih model, jalankan skrip ./run.sh di dalam KazakhTTS/tts1/ folder. Spesifikasi GPU dan RAM dapat ditemukan di folder konfigurasi ( conf/ ).

 ./run.sh --stage 1 --stop_stage 6 --train_config conf/train.yaml

Jika Anda ingin melatih model FastSpeech/Transformer, ubah train_config=conf/train.yaml . Deskripsi terperinci dari setiap tahap didokumentasikan dalam repositori ESPNet.

Model pretrained

Model ini dikembangkan oleh Institute of Smart Systems dan Kecerdasan Buatan, Universitas Nazarbayev Kazakhstan (selanjutnya Issai).

Harap gunakan model hanya untuk tujuan yang baik dan dengan cara yang bijaksana. Anda tidak boleh menggunakan model untuk menghasilkan data yang cabul, ofensif, atau mengandung diskriminasi apa pun sehubungan dengan agama, jenis kelamin, ras, bahasa atau wilayah asal.

Issai menghargai dan membutuhkan atribusi. Atribusi harus mencakup judul makalah asli, penulis, dan nama organisasi di mana pengembangan model berlangsung. Misalnya:

Mussakhojayeva, S., Janaliyeva, A., Mirzakhmetov, A., Khassanov, Y., Varol, Ha (2021) Kazakhtts: Dataset sintesis teks-ke-speech sumber terbuka. Proc. Interspeech 2021, 2786-2790, doi: 10.21437/interspeech.2021-2124. Institut Sistem Cerdas dan Kecerdasan Buatan (Issai.nu.edu.kz), Universitas Nazarbayev, Kazakhstan

kaztts_female1_tacotron2_train.loss.ave

https://issai.nu.edu.kz/wp-content/uploads/2022/03/kaztts_female1_tacotron2_train.loss.ave.zip

kaztts_female2_tacotron2_train.loss.ave

https://issai.nu.edu.kz/wp-content/uploads/2022/03/kaztts_female2_tacotron2_train.loss.ave.zip

kaztts_female3_tacotron2_train.loss.ave

https://issai.nu.edu.kz/wp-content/uploads/2022/03/kaztts_female3_tacotron2_train.loss.ave.zip

kaztts_male1_tacotron2_train.loss.ave

https://issai.nu.edu.kz/wp-content/uploads/2022/03/kaztts_male1_tacotron2_train.loss.ave.zip

Kaztts_Male2_tacotron2_train.loss.ave

https://issai.nu.edu.kz/wp-content/uploads/2022/03/kaztts_male2_tacotron2_train.loss.ave.zip

Vocoders pretrained

Parallelwavegan_female1_checkpoint

https://issai.nu.edu.kz/wp-content/uploads/2022/03/parallelwavegan_female1_checkpoint.zip

Parallelwavegan_female2_checkpoint

https://issai.nu.edu.kz/wp-content/uploads/2022/03/parallelwavegan_female2_checkpoint.zip

Parallelwavegan_female3_checkpoint

https://issai.nu.edu.kz/wp-content/uploads/2022/03/parallelwavegan_female3_checkpoint.zip

Parallelwavegan_Male1_checkpoint

https://issai.nu.edu.kz/wp-content/uploads/2022/03/parallelwavegan_male1_checkpoint.zip

Parallelwavegan_Male2_checkpoint

https://issai.nu.edu.kz/wp-content/uploads/2022/03/parallelwavegan_male2_checkpoint.zip

Sintesis ucapan

Anda dapat mensintesis teks sewenang -wenang menggunakan synthesize.py Script. Ubah baris berikut dalam skrip:

 ## specify the path to vocoder's checkpoint, i.e
vocoder_checkpoint="exp/vocoder/checkpoint-400000steps.pkl"

## specify path to the main model(transformer/tacotron2/fastspeech) and its config file
config_file = "exp/tts_train_raw_char/config.yaml"
model_path = "exp/tts_train_raw_char/train.loss.ave_5best.pth"

Sekarang Anda dapat menjalankan skrip menggunakan teks sewenang -wenang, misalnya:

 python synthesize.py --text "бүгінде өңірде тағы бес жобаның құрылысы жүргізілуде."

File yang dihasilkan akan disimpan di folder tts1/synthesized_wavs .

Kutipan

 @inproceedings{mussakhojayeva21_interspeech,
  author={Saida Mussakhojayeva and Aigerim Janaliyeva and Almas Mirzakhmetov and Yerbolat Khassanov and Huseyin Atakan Varol},
  title={{KazakhTTS: An Open-Source Kazakh Text-to-Speech Synthesis Dataset}},
  year=2021,
  booktitle={Proc. Interspeech 2021},
  pages={2786--2790},
  doi={10.21437/Interspeech.2021-2124}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-24
ukuran 28.7KB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
F5 TTS ComfyUI

2024-11-02
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua