Add-on ini mengimplementasikan driver Synthesizer ucapan untuk NVDA menggunakan model TTS neural. Itu mendukung Piper.
Piper adalah teks saraf lokal yang cepat ke sistem bicara yang terdengar hebat dan dioptimalkan untuk perangkat low-end seperti Raspberry Pi.
Anda dapat mendengarkan sampel suara Piper di sini: sampel suara Piper.
Add-on ini menggunakan Sonata: mesin karat lintas platform untuk model TTS saraf yang sedang dikembangkan oleh Musharraf Omer.
Anda dapat menemukan paket add-on di bawah bagian aset dari halaman rilis
Add-on hanyalah driver, ia datang tanpa suara secara default. Anda perlu mengunduh dan menginstal suara yang Anda inginkan dari The Voice Manager.
Setelah menginstal add-on dan memulai kembali NVDA, add-on akan meminta Anda untuk mengunduh dan menginstal setidaknya satu suara, dan itu akan memberi Anda opsi untuk membuka manajer suara.
Anda juga dapat membuka The Voice Manager dari menu utama NVDA.
Perhatikan bahwa kami sarankan memilih suara berkualitas low atau medium untuk bahasa target Anda, karena mereka umumnya memberikan responsif yang lebih baik. Untuk responsif tambahan, Anda dapat memilih untuk mengunduh varian fast suara dengan biaya kualitas bicara yang sedikit lebih rendah.
Anda juga dapat menginstal suara dari arsip lokal. Setelah mendapatkan file suara, buka Voice Manager, di tab yang diinstal, klik tombol berlabel Install from local file . Pilih file suara, tunggu untuk menginstal suara, dan restart NVDA untuk menyegarkan daftar suara.
Suara yang tersedia saat ini dilatih menggunakan set data TTS yang tersedia secara bebas, yang umumnya berkualitas rendah (kebanyakan buku audio domain publik atau rekaman kualitas penelitian).
Selain itu, kumpulan data ini tidak komprehensif, oleh karena itu beberapa suara mungkin menunjukkan pengucapan yang salah atau aneh. Kedua masalah dapat diselesaikan dengan menggunakan dataset yang lebih baik untuk pelatihan.
Untungnya, pengembang Piper dan beberapa pengembang dari komunitas buta dan tunanetra sedang mengerjakan pelatihan suara yang lebih baik.
Hak Cipta (C) 2024, Musharraf Omer. Perangkat lunak ini dilisensikan berdasarkan GNU General Public License versi 2 (GPL V2).