Tensorvox هو تطبيق مصمم لتمكين توليف الكلام العصبي سهل الاستخدام وخفيف الوزن في سطح المكتب ، يهدف إلى زيادة إمكانية الوصول إلى هذه التكنولوجيا.
تعمل بشكل رئيسي بواسطة TensorFlowtts وأيضًا بواسطة coqui-tts و fits ، يتم كتابتها في C ++/QT النقي ، باستخدام API TensorFlow C للتفاعل مع نماذج TensorFlow (الأولين) ، و libtorch ل pytorch. وبهذه الطريقة ، يمكننا أداء الاستدلال دون الحاجة إلى تثبيت Gigabytes من مكتبات Python ، فقط عدد قليل من DLLs.
دليل مفصل في مستندات جوجل
احصل على نسخة من الإصدارات ، واستخرج .zip وتحقق من مجلد محرك Google للموديلات وتعليمات التثبيت
إذا كنت مهتمًا باستخدام النموذج الخاص بك ، فأنت بحاجة أولاً إلى التدريب ثم تصديره.
Tensorvox يدعم النماذج من ثلاثة repos:
يجب أن يوفر لك هذان الأمثلان إرشادات كافية لفهم ما هو مطلوب. إذا كنت تتطلع إلى تدريب نموذج على وجه التحديد لهذا الغرض ، فإنني أوصي بـ TensorFlowtts ، حيث أنه هو الذي يحمل أفضل الدعم ، و Fits ، لأنه أقرب شيء إلى الكمال مثل اللغات ، يتم توفير الدعم خارج الصندوق للغة الإنجليزية (coqui و tftts ، vits) ، الألمانية والإسبانية فقط (tensorflowttts) ؛ هذا هو ، لن تضطر إلى فعل أي شيء. يمكنك إضافة لغات بدون تعديل رمز ، طالما أن مجموعة Phoneme هي IPA (مجهدة أو مجهدة) ، ARPA ، أو Globalphone ، (افتح مشكلة وسأشرحها لك)
حاليًا ، يتم دعم Windows 10 X64 فقط (على الرغم من أنني سمعت تقارير عن تشغيلها في 8.1).
متطلبات:
بناء بريئة (مع جميع المكتبات المقدمة):
deps في نفس مكان ملفات .pro وملفات المصدر الرئيسي.لاحظ أنه لتجربة قابلة للتنفيذ الجديدة اللامعة ، ستحتاج إلى تنزيل إصدار من البرنامج كما هو موضح أعلاه واستبدال القابل للتنفيذ في هذا الإصدار مع الإصدار الجديد الخاص بك ، بحيث يكون لديك جميع DLLs في مكانها.
TODO: إضافة تعليمات للتجميع من الصفر.
libtorch : https://pytorch.org/cppdocs/installing.html
TensorFlow C API : https://www.tensorflow.org/install/lang_c
CPPFLOW (TF C API -> C ++ Wrapper): https://github.com/serizba/cppflow
Audiofile (للتصدير WAV): https://github.com/adamstark/audiofile
نافذة نمط مظلمة بدون إطار : https://github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
json for modern c ++ : https://github.com/nlohmann/json
r8brain-free-src (Resampling): https://github.com/avaneev/r8brain-free-src
rnnoise (إصدار cmake ، إخراج تقليل): https://github.com/almogh52/rnnoise-cmake
Logitech LED Illumination SDK (Mouse RGB Integration): https://www.logitechg.com/en-us/innovation/developer-lab.html
QCUSTOPLOT : https://www.qcustomplot.com/index.php/introduction
libnumbertext : https://github.com/numbertext/libnumbertext
يمكنك فتح مشكلة هنا أو الانضمام إلى خادم Discord ومناقشة/اسأل أي شيء هناك
لوسائل الإعلام/الترخيص/أي استفسارات رسمية أخرى ، أرسل إلى هذا البريد الإلكتروني: [email protected]
هذا البرنامج نفسه مرخص ، ولكن بالنسبة للنماذج التي تستخدمها ، تنطبق شروط الترخيص الخاصة بهم. على سبيل المثال ، إذا كنت في فيتنام وتستخدم نماذج TensorFlowtts ، فسيتعين عليك التحقق هنا للحصول على بعض التفاصيل