ZeroSpeech TTS without T Unduh - ZeroSpeech TTS without T Kode Sumber Unduh

ZeroSpeech TTS without T

Kode Sumber AI

1.0.0

Unduh

Zerospeech 2019: TTS TANPA T - PYTORCH

Ini adalah kode sumber asli untuk makalah "Pembelajaran ujung ke ujung yang tidak diawasi dari unit linguistik diskrit untuk konversi suara", yang diterima oleh Interspeech 2019.
Feururmore, kami menggunakan implementasi ini untuk bersaing dalam tantangan Zerospeech 2019. Pada papan peringkat dataset kejutan, metode yang diusulkan adalah tempat ^ke -2 dalam hal bitrate rendah , sambil mencapai skor opini rata -rata yang lebih tinggi (MOS) dan CER yang lebih rendah daripada tim 1 ^St Place .
Jangan ragu untuk menggunakan atau memodifikasinya, laporan bug atau saran peningkatan apa pun akan dihargai. Jika Anda memiliki pertanyaan, silakan hubungi [email protected]. Jika Anda menemukan proyek ini bermanfaat untuk penelitian Anda, silakan pertimbangkan untuk mengutip makalah ini, terima kasih!

Awal yang cepat

Pengaturan

Klon repo ini: git clone [email protected]:andi611/ZeroSpeech-TTS-without-T.git
CD ke repo ini: cd ZeroSpeech-TTS-without-T

Menginstal dependensi

Pasang Python 3.
Instal versi terbaru Pytorch sesuai dengan platform Anda. Untuk kinerja yang lebih baik, instal dengan dukungan GPU (CUDA) jika layak. Kode ini berfungsi dengan Pytorch 0.4 dan yang lebih baru.

Menyiapkan data

Unduh dataset Zerospeech.

Dataset Bahasa Inggris:

 wget https://download.zerospeech.com/2019/english.tgz
tar xvfz english.tgz -C data
rm -f english.tgz

Dataset kejutan:

 wget https://download.zerospeech.com/2019/surprise.zip
# Go to https://download.zerospeech.com  and accept the licence agreement 
# to get the password protecting the archive
unzip surprise.zip -d data
rm -f surprise.zip

Setelah membongkar dataset menjadi ~/ZeroSpeech-TTS-without-T/data , pohon data akan terlihat seperti ini:

 |- ZeroSpeech-TTS-without-T
	 |- data
		 |- english
			 |- train
			 	|- unit
			 	|- voice
			 |- test
		|- surprise
			 |- train
			 	|- unit
			 	|- voice
			 |- test

Preprocess Dataset dan sampel file indeks siap-model:
```
 python3 main.py --preprocess —-remake
```

Penggunaan

Pelatihan

Latih model autoencoder ASR-TTS untuk penemuan unit linguistik diskrit:
```
 python3 main.py --train_ae
```
Hyperparameter yang dapat disetel dapat ditemukan di HPS/Zerospeech.json. Anda dapat menyesuaikan parameter ini dan pengaturan dengan mengedit file, hyperparameter default direkomendasikan untuk proyek ini.

Latih TTS Patcher untuk meningkatkan kinerja konversi suara:

 python3 main.py --train_p --load_model --load_train_model_name=model.pth-ae-400000

Latih TTS Patcher dengan pelatihan permusuhan yang dipandu target:

 python3 main.py --train_tgat --load_model --load_train_model_name=model.pth-ae-400000

Monitor dengan Tensorboard (Opsional)

 tensorboard --logdir='path to log dir'
or
python3 -m tensorboard.main --logdir='path to log dir'

Pengujian

Tes pada satu pidato ::

 python3 main.py --test_single --load_test_model_name=model.pth-ae-200000

Tes pada 'sintesis.txt' dan menghasilkan file audio yang disintesis ::

 python3 main.py --test --load_test_model_name=model.pth-ae-200000

Tes pada semua pidato pengujian yang test/ dan hasilkan file pengkodean ::

 python3 main.py --test_encode --load_test_model_name=model.pth-ae-200000

Tambahkan --enc_only jika hanya pengujian dengan Autoencoder ASR-TTS:

 python3 main.py --test_single --load_test_model_name=model.pth-ae-200000 --enc_only
python3 main.py --test --load_test_model_name=model.pth-ae-200000 --enc_only
python3 main.py --test_encode --load_test_model_name=model.pth-ae-200000 --enc_only

Beralih di antara dataset

Cukup gunakan --dataset=surprise untuk beralih ke set alternatif default, semua jalur ditangani secara otomatis jika struktur pohon data ditempatkan seperti yang disarankan. Misalnya:
```
 python3 main.py --train_ae --dataset=surprise
```

Model terlatih

Kami menyediakan model terlatih sebagai file CKPT, tautan DONWLOAD: bit.ly/zerospeech2019-liu
Muat ulang model untuk pelatihan:
```
 --load_train_model_name=model.pth-ae-400000-128-multi-1024-english
```
( --ckpt_dir=./ckpt_english atau --ckpt_dir=./ckpt_surprise secara default).

2 cara memuat model untuk pengujian:

 --load_test_model_name=model.pth-ae-400000-128-multi-1024-english (by name)
--ckpt_pth=ckpt/model.pth-ae-400000-128-multi-1024-english (direct path)

Peduli bahwa HPS/Zerospeech.json perlu ditetapkan sesuai dengan model yang Anda muat. Jika model 128-multi-1024 sedang dimuat, seg_len dan enc_size harus diatur masing-masing ke 128 dan 1024. Jika model ae sedang dimuat, argumen --enc_only harus digunakan saat menjalankan main.py (lihat 4. Di bagian pengujian).

Catatan

Kode ini mencakup semua pengaturan dan metode yang telah kami uji untuk tantangan ini, beberapa di antaranya tidak berhasil tetapi kami tidak menghapusnya dari kode kami. Namun, instruksi sebelumnya dan pengaturan default adalah untuk metode yang kami usulkan. Dengan menjalankannya, seseorang dapat dengan mudah mereproduksi hasil kami.
Todo: Unggah model pra-terlatih

Kutipan

 @article{Liu_2019,
   title={Unsupervised End-to-End Learning of Discrete Linguistic Units for Voice Conversion},
   url={http://dx.doi.org/10.21437/interspeech.2019-2048},
   DOI={10.21437/interspeech.2019-2048},
   journal={Interspeech 2019},
   publisher={ISCA},
   author={Liu, Andy T. and Hsu, Po-chun and Lee, Hung-Yi},
   year={2019},
   month={Sep}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-24
ukuran 73.92MB
Berasal dari Github

Aplikasi Terkait

F5 TTS ComfyUI

2024-11-02
Eksklusif 4K t

2024-06-13
kalos t

2024-05-26
T aplikasi hidupku

2023-09-12
Aplikasi Asisten T

2023-08-18
Menghentikan Zombie di Pemberontak Tanpa Denyut Nadi

2022-08-24

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua