هذا تطبيق بسيط لتسجيل مجموعات بيانات TTS HomeBrew ، التي تم تنفيذها في Python باستخدام Kivy. تتمثل حالة الاستخدام المصممة في عرض سطر النص تلو الآخر وتسجيل مدة صوتية ثابتة من الميكروفون الافتراضي استنادًا إلى طول النص المعروض. سرعة القراءة قابلة للتعديل ويمكن التنقل في النص عن طريق عناصر تحكم بسيطة في حالة حاجة إلى إعادة تسجيل الجملة بسبب الضوضاء ، خطأ السماعة وما إلى ذلك.
لقد اختبرت هذا فقط على Mac OS و Ubuntu ، وأعتقد أنه يمكن تشغيله على Windows مع تعديلات صغيرة. كما أنني لم أختبر واجهة المستخدم الرسومية بشكل جيد وأرسم أحجام وملفات واجهة المستخدم ، لذلك قد يبدو التطبيق غير تقليدي بأحجام نوافذ مختلفة وقرارات سطح المكتب.
يتطلب بيثون 3.
pip install -r requirements.txt
python prompter.py
سيقوم التطبيق بقراءة النص في text.txt في نفس المجلد وعرضه سطرًا سطرًا. اضغط على زر Record وقل الجملة أثناء عرض Recording... سيتوقف التسجيل تلقائيًا بعد بعض الوقت. إذا كان الوقت المخصص ضئيلًا جدًا أو أكثر من اللازم ، فيمكنك ضبطه لسرعة القراءة باستخدام شريط التمرير. سيتم حفظ التسجيلات كملفات .wav على 48000 كيلو هرتز في ~/Desktop/TTS_dataset_recordings ، مع أسماء الملفات المقابلة لأرقام الأسطر في text.txt