
همس ملعب
قم على الفور ببناء تطبيقات الكلام في الوقت الفعلي 2Tex
جربه عبر العرض التوضيحي عبر الإنترنت
Playground.demo.mp4
يثبت
- لديك
Conda Yarn على جهازك - استنساخ أو شوكة هذا المستودع
- قم بتثبيت الواجهة الخلفية والواجهة الأمامية
sh install_playground.sh - راجع config.py للتأكد من أن جهاز النسخ وحساب النوع يتطابق مع الإعداد الخاص بك. راجع config.js للتأكد من أنه يتوافق مع التكوين الخلفي وأن عنوان الواجهة الخلفية صحيح.
- قم بتشغيل
cd backend && python server.py - في محطة مختلفة ، قم بتشغيل
cd interface && yarn start
الوصول إلى نماذج pyannote
يستخدم هذا المستودع المكتبات على أساس نماذج pyannote.audio ، والتي يتم تخزينها في مركز الوجه المعانقة. يجب أن تقبل شروط الاستخدام قبل استخدامها. ملاحظة: تحتاج إلى الحصول على حساب الوجه المعانقة لاستخدام pyannote
- قبول شروط نموذج
pyannote/segmentation - قبول شروط نموذج
pyannote/embedding - قبول شروط نموذج
pyannote/speaker-diarization - تثبيت HuggingFace -Cli وقم بتسجيل الدخول باستخدام رمز الوصول إلى المستخدم (يمكن العثور عليه في الإعدادات -> رموز الوصول)
حدود
- حجم النموذج: اختر حجم النموذج ، من Tiny إلى V2 كبير.
- اللغة: حدد اللغة التي ستتحدث فيها.
- مهلة النسخ: قم بتعيين عدد الثواني التي سينتظرها التطبيق قبل نسخ بيانات الصوت الحالية.
- حجم الشعاع: اضبط عدد النسخ المتولدة والنظر ، مما يؤثر على وقت توليد الدقة وتوليد النسخ.
- طريقة النسخ: اختر "الوقت الفعلي" للمذكرات والنسخ في الوقت الفعلي ، أو "متسلسل" للنسخ الدورية مع المزيد من السياق.
استكشاف الأخطاء وإصلاحها
- على MacOS ، إذا فشل بناء العجلة لأجهزة Safetensors ، قم بتثبيت Rust
brew install rust وحاول مرة أخرى.
الحشرات المعروفة
- في الوضع المتسلسل ، قد يكون هناك تبديل مكبر الصوت غير المنضبط.
- في الوضع الحقيقي ، لن يتم نسخ بيانات الصوت التي لا تلبي مهلة النسخ.
لم يتم اختبار هذا المستودع لجميع اللغات ؛ يرجى إنشاء مشكلة إذا واجهت أي مشاكل.
رخصة
يتم إصدار هذا المستودع والرمز والأوزان النموذجية للهمس تحت رخصة معهد ماساتشوستس للتكنولوجيا.