openai whisper realtime
1.0.0
هذه تجربة سريعة لتحقيق النسخ في الوقت الفعلي تقريبًا باستخدام الهمس.
تثبيت المتطلبات:
pip install -r requirements.txt
قم بتشغيل البرنامج النصي:
python openai-whisper-realtime.py
التبعيات:
يوصى باستخدام وحدة المعالجة المركزية السريعة أو وحدة معالجة الرسومات.
يتم التقاط إدخال الصوت الافتراضي للأنظمة مع Python ، مقسمة إلى قطع صغيرة ثم يتم تغذيتها إلى وظيفة النسخ الأصلية في Openai. إنه يحاول (حاليًا بشكل سيء إلى حد ما) اكتشاف فواصل الكلمات ولا يقسم المخزن المؤقت للصوت في تلك الحالات. مع كيفية تصميم النموذج ، ليس من المنطقي القيام بذلك ، لكنني وجدت أنه سيكون من المفيد المحاولة. إنه يعمل بشكل جيد.