Proyek ini menyediakan aplikasi TTS Islandia untuk layanan Android TTS. Keadaan proyek saat ini siap produksi .
Aplikasi ini tersedia di Google Play Store.
Símarómur menyediakan akses ke suara-suara di perangkat saraf yang dibundel melalui aset.
Saat ini, ada satu suara pria yang tersedia, bernama Steinn . Suara ini tidak hanya sangat dapat dipahami tetapi juga memiliki nada yang menyenangkan dan menarik, menjadikannya opsi serbaguna, tujuan umum yang menetapkan standar untuk teknologi teks-ke-speech (TTS) di Icelandic. Ini sangat cocok untuk membaca teks pendek dan panjang, memberikan pengalaman mendengarkan yang konsisten.
Kami sedang mengembangkan model multi-speaker yang akan mencakup suara wanita, dijadwalkan untuk rilis di masa depan.
Pengguna dapat menambahkan entri normalisasi untuk mengakomodasi pengucapan alternatif kata atau token. Pengucapan alternatif ini lebih diutamakan daripada aturan normalisasi bawaan, menerapkan penggantian yang ditentukan untuk istilah yang ditemukan dalam teks yang sedang dibaca.
Untuk menyederhanakan penggunaan, penggantian dapat dilakukan pada level grapheme tanpa perlu memahami atau menggunakan sintaks ekspresi reguler. Pengguna dapat segera mendengar bagaimana istilah yang dimasukkan dan suara penggantinya dengan suara saat ini dengan menggunakan tombol play.
Secara default, kamus normalisasi pengguna mulai kosong. Saat ini, mengimpor atau mengekspor kamus tidak didukung.
Normalisasi teks Islandia dilakukan sebelum teks memasuki G2P. Suara lokal G2P berbasis aturan dan diimplementasikan menggunakan C ++ Frameworks Thrax & OpenFST, yang diakses melalui JNI.
Suara -suara Flite yang sudah usang dan suara -suara jaringan saraf sebelumnya. Saat ini, suara -suara flite sudah usang dan kami menggunakan suara jaringan murni saraf sebagai gantinya. Proyek Flite nyaris tidak dipertahankan, dan kinerja runtime dari Neural Network Voices mendekati suara -suara Flite dengan cepat. Kami dapat mencapai kecepatan 25x realtime dengan model jaringan saraf pada ponsel Pixel 6.
Model jaringan saraf didasarkan pada VIT dan dilatih melalui Piper TTS.
Proyek ini menggunakan versi OpenFST & Thrax kami dengan perbaikan yang sesuai untuk dibangun untuk Android di dalam cabang android . Silakan bangun & pasang ini terlebih dahulu, sebelum menyusun Símarómur.
Untuk pekerjaan CI kami, kami telah melakukan prebuilt semua perpustakaan yang bergantung dan diterbitkan sebagai aset rilis GitHub di situs proyek yang sesuai. Anda dapat memanfaatkan ini dan menginstalnya secara lokal di dalam direktori proyek Anda melalui prosedur berikut:
Set variabel lingkungan untuk versi rilis yang digunakan, misalnya:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-androidKemudian jalankan skrip ini:
.github/scripts/dl_3rdparty.sh Ini harus mengunduh dan mengekstrak semua binari yang diperlukan ke sub-direktori 3rdparty/ndk .
Ambil subdirektori aset suara melalui
git submodule update --init Kemudian buat file local.properties jika belum ada dan menambahkan variabel 3rdparty.dir untuk pustaka openfst/thrax yang diinstal, misalnya
3rdparty.dir=/Users/fred/install-android
Atau jika Anda telah mengunduh rilis kami melalui dl_3rdparty.sh , point variabel -variabel ini ke direktori proyek Anda simaromur/3rdparty/ndk , misalnya:
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
Mungkin juga perlu, untuk mengadaptasi/membatalkan komentar variabel ndkVersion di dalam aplikasi/build.gradle tergantung pada versi NDK yang Anda instal. Kemudian bangun proyek di dalam Android Studio.
Anda dapat berkontribusi pada proyek ini dengan membagikannya, membuat cabang dan membuka permintaan tarik baru.
Semua kode adalah Hak Cipta © 2021-2024 Grammatek EHF. Kode ini dilisensikan di bawah lisensi Apache.
Kami menggunakan Sonic Libraries 3RDParty untuk kecepatan audio dan manipulasi pitch. Sonic adalah Copyright 2010, 2011 oleh Bill Cox dan dilisensikan di bawah lisensi Apache. Símarómur menggunakan versi yang disesuaikan dari Thrax dan OpenFST untuk G2P. Ini juga dilisensikan di bawah lisensi Apache. Selain itu, kami menggunakan OpenNLP untuk tokenisasi dan pemisahan kalimat. OpenNLP dilisensikan di bawah lisensi Apache.
Sebagian besar dari perangkat lunak ini telah dikembangkan di bawah naungan Program Teknologi Bahasa 5 Tahun Pemerintah Islandia, yang dijelaskan di sini dan di sini (Bahasa Inggris).