Unduh shanghainese tts - Download Kode Sumber shanghainese tts

shanghainese tts

Kode Sumber AI

2023.06.06

Unduh

TTS SHANGHAIN

Dartmouth Ling 48 Proyek Akhir: Meningkatkan TT untuk Shanghainese
Yuanhao Chen [email protected] Spring 2023

Sasaran

Untuk membangun sistem Text-to-Speech (TTS) untuk Shanghain dari awal, berusaha untuk meningkatkan produksi nada Sandhi dibandingkan dengan model yang ada dengan memberikan perhatian khusus pada preprocessing teks.

Keterangan

Lihat writeup/main.pdf.

Dependensi

pip install -r phonemisation/requirements.txt
pip install -r speech_synthesis/requirements.txt
pip install -r comparison_questionnaire/requirements.txt  # for analysis of questionnaire results

Penggunaan

Lihat speech_synthesis/README.md .

Struktur

phonemisation/ : Berisi modul fonemisasi
- Lihat Penjelasan Output dalam phonemisation/__init__.py
- Penggunaan: python -m phonemisation "text to phonemise"
- Mekanisme: Kalimat Cina - Segmentasi Kata ⟶ Kata -kata Cina - Romanisasi ⟶ Shanghainese Pinyin - Fonemisation ⟶ Fonem Shanghainese
  - jieba digunakan untuk segmentasi kata
  - Kamus Shanghain yang sebelumnya saya buat digunakan untuk romanisasi
    - Menggunakan modul Qieyun untuk menambahkan nada nomor 1 ke suku kata 陰平 nada yinping / inbin ; Nada lain secara fonologis tidak bertanda
  - Fungsi romanisation_to_ipa dalam romanisation.py berisi fungsi fonemisasi
make_metadata.py : menggunakan modul phonemisation untuk mengubah transkripsi menjadi IPA dan menghasilkan metadata untuk pelatihan
- Lihat di bawah dalam data/
data/ : Berisi dataset yang digunakan untuk pelatihan
- Transkripsi dan file audio diadaptasi dari repo ini
  - Downsampled ke 16kHz untuk pelatihan
  - Saat ini, hanya shh.dict.cn/ yang digunakan untuk pelatihan
- File */metadata.txt dihasilkan oleh make_metadata.py
training/
- Juptyer Notebook untuk melatih model
- Dimaksudkan untuk diunggah dan dijalankan di lingkungan Google Colab; perlu dimodifikasi untuk penggunaan lokal
- Menggunakan repo coqui-ai/TTS , yang berisi implementasi vits
writeup/ : Tulisannya
speech_synthesis/ : berisi model sintesis bicara
- Lihat speech_synthesis/README.md untuk lebih jelasnya
comparison_questionnaire/ : berisi file kuesioner dan audio yang digunakan untuk membandingkan pidato yang dihasilkan oleh model ini, model Apple, dan pembicara manusia
- *-1.wav : Diproduksi oleh model ini
- *-2.wav : Diproduksi oleh Apple Voiceover (MacBook Pro 14-inci, 2021; MacOS Ventura 13.0.1)
- *-3.wav : diucapkan sendiri
- stats.ipynb : Jupyter Notebook untuk menganalisis hasil kuesioner

Memperluas

Informasi Tambahan

Versi 2023.06.06
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-22
ukuran 581.42MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Informasi bahasa Inggris tentang pengembangan suara (Panduan Pengguna TTS versi Delphi)

2009-05-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua