Analisis Bicara/Sistem Sintesis untuk TT dan Aplikasi Terkait.
Perangkat lunak ini didasarkan pada metode yang dijelaskan dalam makalah:
F. Espic, C. Valentini-Botinhao, dan S. King, "Pemodelan Langsung Besarnya dan Spektrum Fase untuk Sintesis Bicara Parametrik Statistik," dalam Proc. Interspeech, Stockholm, Swedia, Agustus, 2017.
@ Penulis: Felipe Espic
Informasi lebih lanjut di http://www.felipeespic.com/magphase/
Ini adalah analisis bentuk gelombang ucapan/sistem sintesis yang digunakan dalam sintesis ucapan parametrik statistik (SPSS).
Modul analisis mengekstrak empat aliran fitur yang menggambarkan spektrum magnitudo, spektrum fase, dan F0. Fitur -fitur ini dapat digunakan untuk melatih model regresi (misalnya, DNN, LSTM, hmm. Dll.) Jadi, nilai yang diprediksi dapat dihasilkan. Modul sintesis mengambil fitur -fitur ini pada input untuk menghasilkan bentuk gelombang yang disintesis akhir.
Poin -Poin Kunci:
Lihat file lisensi untuk detailnya.
pip install numpy scipy soundfile matplotlib
Unduh magphase: git clone https://github.com/CSTR-Edinburgh/magphase.git
Unduh dan Kompilasi SPTK dan Reaper oleh:
cd magphase/tools
./download_and_compile_tools.sh
Ini akan menyusun dan mengkonfigurasi SPTK dan Reaper secara otomatis untuk Anda ... dan hanya itu!
Pergi saja /demos , baca instruksi di dalam skrip demo, yang sangat discriptif. Mereka harus kehabisan kotak dengan menjalankan python <demo_script> .
Kami merekomendasikan bahwa Anda bermain pertama dengan demo_copy_synthesis_lossless.py , dan kemudian demo_copy_synthesis_low_dim.py keduanya melakukan analisis/rutinitas sintesis.
Kemudian, Anda dapat memodifikasi skrip demo yang sesuai dengan kebutuhan Anda.
Catatan: Ingat saja untuk menjalankan skrip dari lokasi mereka.
Kami menyediakan dua demo yang didistribusikan dengan distribusi resmi Merlin. Ini menunjukkan contoh -contoh dari Merlin dengan integrasi magphase:
Text-to-Speech: Demo SLT_ARCTIC Merlin (versi subset kecil dan penuh)
Konversi Suara: Demo Konversi Suara Merlin (diuji secara kasar)
Kami membutuhkan bantuan untuk meningkatkan perangkat lunak ini. Anda dapat melakukan kolaborat oleh:
Membangun suara TTS menggunakan Merlin dan Magphase dan bandingkan dengan Vocoders lain, misalnya, dunia. Lalu, tolong beri tahu kami hasil Anda. Kami telah menguji magphase hanya dengan beberapa suara dan diperlukan untuk menutupi rentang yang lebih luas. Kami baru -baru ini memperbaiki beberapa bug yang keluar berkat orang yang melaporkan hasil mereka menggunakan data baru.
Menerapkan dukungan frame rate variabel asli di Merlin. Magphase bekerja dalam fashion frame rate variabel (pitch sinkron).