中文
قاعدة على Whisper و Pyqt (Pyside6) ، وهي أداة محادثة صوتية في الوقت الفعلي ، تدعم المحادثات التاريخية. استمتع بالدردشة مع صوت GPT دون الاعتماد على ChatGpt Plus. ؟
بيثون> = 3.10
Win10+، Linux (فقط اختبر في Ubuntu ، Works) ، Mac (استنادًا إلى Linux كمرجع ، مجدي نظريًا ، ولكن لم يتم اختباره.)
يتطلب تشغيل whisper base model أقل من 1 جيجابايت من الذاكرة المتاحة ، وتكون النتائج غير قابلة للمرور دون ضوضاء ومعدل دقة حوالي 90 ٪ في حالات اللغة المنطوقة الدقيقة. يتطلب whisper large model أكثر من 8 جيجابايت من الذاكرة المتاحة ، ومع ذلك يوفر أداءً ممتازًا. حتى مهاراتي الفقيرة في التحدث باللغة الإنجليزية يتم الاعتراف بها بدقة إلى حد ما. علاوة على ذلك ، فإنه يتعامل مع قطاعات الكلام الطويلة والانقطاعات بشكل فعال.
باختصار ، يكون النموذج الأساسي أكثر سهولة في الاستخدام ، ولكن إذا سمحت الظروف ، فمن المستحسن استخدام النموذج الكبير. في حالات أخطاء الاعتراف ، يمكن إجراء التعديلات مباشرة على النتائج المعترف بها في واجهة المستخدم الرسومية.
استنساخ repo
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoiceإنشاء وتفعيل بيئة افتراضية. (PowerShell. في باش ، قد تحتاج إلى تشغيل البرامج النصية مثل التنشيط.)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1تثبيت التبعيات.
pip install -r requirements.txtفي Linux ، تحتاج إلى تشغيل الأمر التالي لتثبيت التبعيات المطلوبة.
apt install portaudio19-dev python3-pyaudio
apt install espeakتنفيذ مباشرة داخل الافتراضية ENV.
python ./main.py
لدي مضيف Linux مع 12 جيجابايت من ذاكرة GPU وجهاز كمبيوتر محمول مع وحدة معالجة الرسومات الضعيفة 1650. لتشغيل الطراز الكبير الهامس ، يمكنك استضافة Whisper على Linux واستخدام اتصال WebSocket بين العميل والهمس.
Linux :
python scrpit/whisper_server.py --model large-v2
عميل:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809بعد تمكين الوكيل ، ستمر جميع طلبات Openai GPT وتنزيلات النماذج عبر عقدة الوكيل.
PYQT-FLUENT-WIDGETS مكتبة مصادقة تصميم بطلاقة تعتمد على PYQT5