تفاعل صوت سلس وفي الوقت الحقيقي مع الذكاء الاصطناعي.
تلميح: أي شخص مهتم بحلول صوتية حديثة ، يرجى أيضًا إلقاء نظرة على Linguflex . يتيح لك التحكم في بيئتك من خلال التحدث وهي واحدة من أكثر المساعدين الذين يتوفرون مصادر مفتوحة ومتطورة حاليًا.
يستخدم Faster_Whisper و Elevenlabs تدفق الإدخال لاستجابات الكمون المنخفضة للمدخلات المنطوقة.
؟ شاهد فيديو تجريبي
ملاحظة : يتم إجراء العرض التوضيحي على اتصال 10 ميجابت/ثانية ، لذلك قد يكون الأداء الفعلي أكثر إثارة للإعجاب على اتصالات أسرع.
voice_talk_vad.py - يكتشف الكلام تلقائيًا
voice_talk.py - تبديل التسجيل/إيقاف تشغيله مع شريط المسافة
استبدل your_openai_key و your_elevenlabs_key بقيم مفتاح API Openai و ElevenLabs في الكود.
تثبيت مكتبات Python المطلوبة:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch قم بتنفيذ البرنامج النصي الرئيسي بناءً على تفضيلات الوضع الخاص بك:
python voice_talk_vad.pyأو
python voice_talk.pyvoice_talk_vad.py : تحدث إلى الميكروفون الخاص بك.
استمع إلى الرد.
voice_talk.py :لا تتردد في الشوكة والتحسين وتقديم طلبات السحب. إذا كنت تفكر في تغييرات أو إضافات كبيرة ، فيرجى البدء بفتح مشكلة.
صيحة ضخمة ل: