يوفر هذا المشروع تطبيق TTS الأيسلندي لخدمة Android TTS. الوضع الحالي للمشروع جاهز للإنتاج .
التطبيق متاح في متجر Google Play.
يوفر Símarómur إمكانية الوصول إلى أصوات الشبكة العصبية على الأجهزة التي يتم تجميعها عبر الأصول.
حاليا ، هناك صوت ذكر واحد متاح ، يدعى شتاين . هذا الصوت ليس واضحًا للغاية فحسب ، بل يمتلك أيضًا نغمة ممتعة وجذابة ، مما يجعله خيارًا متعدد الاستخدامات للأغراض العامة الذي يحدد المعيار لتكنولوجيا النص على الجهاز الأيسلندي (TTS). إنه مناسب تمامًا لقراءة النصوص القصيرة والطويلة ، مما يوفر تجربة استماع ثابتة.
نقوم حاليًا بتطوير نموذج متعدد الحوامل سيتضمن صوتًا للإناث ، من المقرر إصداره في المستقبل.
يمكن للمستخدمين إضافة إدخالات التطبيع لاستيعاب النطق البديل للكلمات أو الرموز. هذه النطقات البديلة لها الأسبقية على قواعد التطبيع المدمجة ، وتطبيق البدائل المحددة لأي مصطلحات من هذا القبيل موجودة في النص الذي يتم قراءته.
لتبسيط الاستخدام ، يمكن إجراء بدائل على مستوى Grapheme دون الحاجة إلى فهم أو استخدام بناء جملة التعبير العادي. يمكن للمستخدمين على الفور سماع كيف تم إدخال المصطلح وصوته البديل مع الصوت الحالي باستخدام أزرار التشغيل.
بشكل افتراضي ، يبدأ قاموس تطبيع المستخدم فارغًا. في الوقت الحاضر ، لا يتم دعم استيراد أو تصدير القاموس.
يتم تنفيذ تطبيع النص الأيسلندي قبل أن يدخل النص G2P. يعتمد Voice G2P المحلي على القواعد ويتم تنفيذه باستخدام C ++ Frameworks Thrax & OpenFST ، والتي يتم الوصول إليها عبر JNI.
أصوات Flite التي تم إهمالها وأصوات الشبكة العصبية السابقة. في الوقت الحاضر ، تكون أصوات Flite قديمة ونستخدم أصوات الشبكة العصبية البحتة بدلاً من ذلك. بالكاد يتم الحفاظ على مشروع FLITE ، ويغلق أداء وقت التشغيل لأصوات الشبكة العصبية على أصوات Flite بسرعة. يمكننا تحقيق سرعة حقيقية 25x مع نموذج الشبكة العصبية على هاتف Pixel 6.
يعتمد نموذج الشبكة العصبية على حالات وتدريب عبر TTS Piper.
يستخدم هذا المشروع إصداراتنا من OpenFst & Thrax مع الإصلاحات المناسبة للبناء لنظام Android داخل الفرع android . يرجى إنشاء وتثبيت هذه أولاً ، قبل تجميع Símarómur.
بالنسبة لوظائف CI الخاصة بنا ، قمنا بالفعل بباكبة جميع المكتبات المعتمدة ونشرنا كأصول إصدار GitHub في موقع المشروع المقابل. يمكنك الاستفادة منها وتثبيتها محليًا داخل دليل المشروع الخاص بك عبر الإجراء التالي:
تعيين متغيرات البيئة لإصدارات الإصدار المستخدمة ، على سبيل المثال:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-androidثم قم بتشغيل هذا البرنامج النصي:
.github/scripts/dl_3rdparty.sh يجب أن يقوم هذا بتنزيل واستخراج جميع الثنائيات اللازمة إلى الدليل الفرعي 3rdparty/ndk .
جلب الأصول الصوتية الدليل عبر
git submodule update --init ثم قم 3rdparty.dir الملف local.properties
3rdparty.dir=/Users/fred/install-android
أو في حالة تنزيل إصداراتنا عبر dl_3rdparty.sh ، قم بإشارة هذه المتغيرات إلى دليل المشروع الخاص بك simaromur/3rdparty/ndk ، على سبيل المثال:
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
قد يكون من الضروري أيضًا ، لتكييف/إلغاء التغير المتغير ndkVersion داخل التطبيق/build.gradle اعتمادًا على إصدار NDK المثبت. ثم بناء المشروع داخل Android Studio.
يمكنك المساهمة في هذا المشروع عن طريق التغلب عليه ، وإنشاء فرع وفتح طلب سحب جديد.
كل الكود هو حقوق الطبع والنشر © 2021-2024 Grammatek EHF. تم ترخيص هذا الرمز بموجب ترخيص Apache.
نستخدم مكتبات 3RDPARTY Sonic لسرعة الصوت ومعالجة الملعب. Sonic Is Copyright 2010 ، 2011 by Bill Cox وهي مرخصة بموجب ترخيص Apache. يستخدم Símarómur إصدارات مكيفة من Thrax و OpenFST لـ G2P. هذه مرخصة أيضًا بموجب ترخيص Apache. علاوة على ذلك ، نستخدم OpenNLP للرمز المميز وتقسيم الجملة. تم ترخيص OpenNLP بموجب ترخيص Apache.
تم تطوير جزء كبير من هذا البرنامج تحت رعاية برنامج تكنولوجيا اللغة أيسلندي لمدة 5 سنوات ، الموصوفة هنا وهنا (الإنجليزية).