Catatan: Add-on ini serta dokumentasi masih sedang dibangun. Kontribusi Anda dipersilakan!
Ingat bahwa ForwardTacotron adalah model sintesis ucapan di Pytorch yang menggunakan prediktor durasi untuk menyelaraskan teks dan menghasilkan spektrogram Mel. Model ini memiliki keunggulan, seperti ketahanan, kecepatan, manipulasi nada dan energi, dan efisiensi.
Jadi, plugin ini merupakan upaya untuk mengimplementasikan dukungan untuk ForwardTacotron di pembaca layar open source NVDA melalui klien/server, karena pustaka yang digunakan sebagai obor tidak mungkin untuk dimasukkan dalam NVDA secara langsung.
Ini adalah pekerjaan yang sedang berlangsung dan karena itu masih banyak yang harus dilakukan.
Sementara itu, Anda dapat mendengarkan kemajuan yang telah dibuat sejauh ini.
| Bahasa | Suara | Mencicipi |
|---|---|---|
| Bahasa inggris | LJSPEECH (dengan Griffinlim Vocoder) | |
| Bahasa inggris | Ljspeech (dengan vocoder hifi) | |
| Spanyol | Dataset ALD (dengan vocoder hifi-gan) | |
| Spanyol | Odal (dengan vocoder hifi, model universal) |