tts-dataset-prompts
[مهجور إلى حد كبير ، آسف!]
يهدف هذا المستودع إلى أن يكون مجموعة جيدة من الجمل للأشخاص الذين يتطلعون إلى استنساخ أصواتهم الخاصة (على سبيل المثال باستخدام Tacotron 2).
تهدف كل مجموعة من 50 خطًا إلى الوفاء بالمعايير التالية:
- يتم تمثيل كل صوتي مرة واحدة على الأقل ، وفقًا لـ Cmudict (يتم احتساب إصدارات مختلفة من حروف العلة على أنها صوتيات منفصلة ؛ يجب أن تكون العوامل الساكنة حاضرة مرتين)
- كل صوتي يتكرر تقريبًا كما هو الحال في الكلام العادي (بين 50 ٪ و 150 ٪ من التردد الموجود في موبي ديك ، ما لم يكن الصوتي موجودًا فقط 4 مرات أو أقل في الدفعة)
- كل سطر متساوٍ تقريبًا عند التحدث (14-18 المقاطع + علامات الترقيم غير النهائية)
- يتم تجنب الكلمات ذات النطقات المعتمدة على السياق (باستثناء تلك الشائعة جدًا ،
the ) لسهولة المعالجة - 10 خطوط على الأقل تحتوي على فواصل
- تتكون 10 خطوط على الأقل من جمل أقصر متعددة (بحيث يتعلم الذكاء الاصطناعى التوقف بشكل طبيعي)
سيتم توفير ملفات نصية إضافية للسؤال والعلامة علامات التعجب ، باتباع نفس القواعد. لقد تم فصلها لأن بعض بنيات النص إلى الكلام تتعامل بشكل سيء مع إنهاء علامات الترقيم التي تؤثر على تجويد الجملة بأكملها. قد يكون من المفيد استخدامها لتدريب نموذج منفصل ، كما أوصت به Talqu ، كما حدث لبعض الأصوات في خدمة Mekatron (انتهاء).
يستخدم هذا الريبو مكتبة G2P-EN لتحديد تعدادات الصوتيات ، من أجل مطابقة صوتية Uberduck.
مجموعات موجهة جيدة أخرى
- (متعدد اللغات!) نصوص مثال Microsoft CustomVoice (ليست جميع قوائم المطالبات مصممة بشكل جيد ، على سبيل المثال ، تتضمن مطالبات الدردشة en-us فقط / ʒ / كجزء من كلمة "إندونيسيا")
- قوس قزح ممر وجد مرور (اكتمال صوتيا)
- قائمة مطالبات CMU Arctic (متوازنة صوتيًا ، ولكن جملة واحدة فقط لكل سطر)
- Mocha-timit ("مصمم لتشمل عمليات الكلام الرئيسية المتصلة باللغة الإنجليزية (مثل الاستيعاب ، أشكال ضعيفة ..)")
- توقيت (كومة من الجمل العشوائية في الغالب)
- (متعددة اللغات!) جمل صوتية شائعة (وليس على الإطلاق متوازن صوتيًا ، وهي قصيرة جدًا أيضًا)
- نسخة LJSPEEDE (شظايا الجملة كثيرة ، والتي أفكر فيها شخصياً على أنها مفيدة)
- جمل هارفارد (متوازنة صوتيًا ، ولكن جملة واحدة فقط لكل سطر وكلها متساوية الطول)
- قائمة الضبع السريع للسباق (كل من اللغة الإنجليزية والصينية ، ولكن الجمل القصيرة للغاية والقواعد ليست مثالية)