هذه الوظيفة الإضافية تنفذ برنامج تشغيل مزج الكلام لـ NVDA باستخدام نماذج TTS العصبية. وهو يدعم بايبر.
Piper هو نص عصبي سريع إلى نظام خطاب يبدو رائعًا ويتم تحسينه للأجهزة المنخفضة مثل Raspberry Pi.
يمكنك الاستماع إلى عينات صوت Piper هنا: عينات صوت Piper.
تستخدم هذه الوظيفة الإضافية Sonata: محرك الصدأ عبر المنصات لنماذج TTS العصبية التي يتم تطويرها بواسطة Musharraf Omer.
يمكنك العثور على الحزمة الإضافية ضمن قسم الأصول في صفحة الإصدار
الوظيفة الإضافية هي مجرد برنامج تشغيل ، فهو لا يحتوي على أي أصوات افتراضيًا. تحتاج إلى تنزيل وتثبيت الأصوات التي تريدها من مدير الصوت.
عند تثبيت الوظيفة الإضافية وإعادة تشغيل NVDA ، ستطلب منك الوظيفة الإضافية تنزيل وتثبيت صوت واحد على الأقل ، وسيعطيك خيار فتح مدير الصوت.
يمكنك أيضًا فتح مدير الصوت من القائمة الرئيسية لـ NVDA.
لاحظ أننا نوصي باختيار أصوات الجودة low أو medium للغة (لغتك) المستهدفة ، لأنها توفر بشكل عام استجابة أفضل. للحصول على استجابة إضافية ، يمكنك اختيار تنزيل البديل fast للصوت بتكلفة من جودة الكلام أقل قليلاً.
يمكنك أيضًا تثبيت أصوات من المحفوظات المحلية. بعد الحصول على ملف Voice ، افتح Voice Manager ، في علامة التبويب المثبتة ، انقر فوق الزر المسمى Install from local file . اختر الملف الصوتي ، وانتظر حتى يتم تثبيت الصوت ، وإعادة تشغيل NVDA لتحديث قائمة الأصوات.
يتم تدريب الأصوات المتوفرة حاليًا باستخدام مجموعات بيانات TTS المتوفرة بحرية ، والتي يتمتع بشكل عام ذات جودة منخفضة (معظمها كتب صوتية للمجال العام أو تسجيلات جودة البحث).
بالإضافة إلى ذلك ، فإن مجموعات البيانات هذه ليست شاملة ، وبالتالي قد تظهر بعض الأصوات نطقًا غير صحيح أو غريب. يمكن حل كلتا المشكلتين باستخدام مجموعات بيانات أفضل للتدريب.
لحسن الحظ ، يعمل مطور Piper وبعض المطورين من المجتمع المكفوفين والمنفذ في الرؤية على تدريب أصوات أفضل.
حقوق الطبع والنشر (ج) 2024 ، مشرف عمر. تم ترخيص هذا البرنامج بموجب إصدار ترخيص GNU العام 2 (GPL V2).