Tacotron 2 الألمانية و melgan متعددة النطاق في Tensorflow مع دعم الاستدلال TF لايت
دعمت Google هذا العمل من خلال توفير ائتمان Google Cloud. شكرا لك Google لدعم المصدر المفتوح! ؟
أقوم بإصدار نماذج النص العصبي الألماني المسبق (TTS) Tacotron 2 و Multi-Band Melgan. وهو يدعم الاستدلال مع تنسيقات saved_model و TF Lite ، ويمكن العثور على جميع النماذج على مركز TensorFlow.
قل مرحبًا في المناقشات إذا وجدت أنه مفيد لأي شيء.
inference.py لاستنتاج مع saved_model .inference_tflite.py لاستنتاج مع TF Lite .e2e-notebook.ipynb للتحقق من كيفية تصدير هذه التنسيقات النموذجية.لقد دربت هذه النماذج على مجموعة بيانات Thorsten بواسطة Thorsten Müller. وهي مرخصة بموجب شروط Creative Commons Zero V1 Universal (CC0) ، والتي تُستخدم لإلغاء الاشتراك في حقوق الطبع والنشر تمامًا والتأكد من أن العمل لديه أوسع نطاق. شكرا @thorstenmueller لمثل هذه المساهمة الكبيرة للمجتمع.
يقوم بعض الأشخاص الطيبين بعمل رائع في Tensorspeech/TensorFlowtts ، والتي كانت تدعم بالفعل TTS باللغة الإنجليزية والصينية والكورية. كنت أرغب في المساهمة في الدعم للألمانية وتدريب هذه النماذج. الآن يدعم كل من التدريب والاستدلال مع المعالجات المناسبة. ستتابع منشور مدونة مفصل ، ولكن بعض الملاحظات السريعة في الوقت الحالي:
Tacotron 2 بعض الضوضاء في النهاية ، وتحتاج إلى قطعها. مرة أخرى ، توضح أمثلة الاستدلال كيفية القيام بذلك.Multi-band MelGAN إلى TF Lite دون تحسينات لأنها أنتجت بعض ضوضاء الخلفية عندما قمت بتصديرها مع تلك الافتراضية. لقد استخدمت التحسينات الافتراضية في Tacotron 2 .saved_model التي أطلقها هنا ليست مناسبة للتركين. يستخدم تطبيق الهندسة المعمارية Subclassing API في TensorFlow 2.x ويحصل على مدخلات متعددة في طريقة call لإجبار المعلم أثناء التدريب. تسبب هذا في بعض المشكلات عند التصدير إلى saved_model واضطررت إلى إزالة هذا المنطق قبل التصدير. إذا كنت ترغب في فني النماذج ، فيرجى الاطلاع على شوكة TensorFlowtts. يمكنك استخدام هذه القطع الأثرية النموذجية المسبقة وأمثلة التعليمات البرمجية بموجب شروط ترخيص Apache 2.0. من ناحية أخرى ، قد ترغب في الاتصال بي للاستشارات و/أو التعاون المدفوع في مشاريع الكلام و/أو NLP على عنوان البريد الإلكتروني المعروض في ملف التعريف الخاص بي.