إيرينا هي مساعد صوت روسي للعمل في وضع عدم الاتصال. يتطلب Python 3.5+ (يمكن أن يكون الاعتماد أقل ، ولكن على أي حال Python 3)
يدعم الإضافات (المهارات).
مقال عن هابري | المقالة الثانية عن هابري | المقالة الثالثة عن هابري | مجموعة في برقية
من خلال خدمة Vsegpt.ru ، مشروع آخر لمؤلف Irina:
انتقل إلى https://github.com/janvarev/irene-va-win-
بعد التثبيت ، ستكون الأوامر التالية متاحة: "Irina Hello" ، "Irina Rame the Coin" ، "Irina tear the Cube" ، "Irina the Game أصغر" ، "Irina Timer ثلاث دقائق"
لإعداد المشكلات أو حلها ، ابدأ start-settings-manager.bat لبدء تشغيل الإعدادات ، يمكنك إنهاء الإضافات ومعرفة أوامر إضافية.
المزيد من الأرصفة لربط هذا الخيار: docs/install_win_compact.md
بعد التثبيت ، ستكون الفرق غير المتصلة متاحة (لأن هذا تكوين افتراضي). مثال: "Irina Hello" ، "Irina تمزيق العملة" ، "Irina تمزيق المكعب" ، "Irina the Game أصغر" ، "Irina Timer ثلاث دقائق"
كيفية إعداد هذا الخيار: docs/install_win_compact.md
ستحتاج إلى Python المثبت (حوالي 3.7-3.11).
لتثبيت جميع التبعيات المطلوبة بسرعة ، يمكنك استخدام الأمر: pip install -r requirements.txt (بالنسبة إلى Linux و MacOS - قم بتثبيت الحزم الأولى لـ Audioplayer)
للبدء ، قم بتشغيل ملف Runva_vosk.py من المجلد الجذر. بشكل افتراضي ، سيطلق مؤيد Vosk دون اتصال بالإنترنت للتعرف على الكلام مع الميكروفون ، ومحرك Pytsx للتعبير عن مساعد المزيد عن Pyttsx هنا.
بعد البدء ، يمكنك التحقق من فريق بسيط - قل "Irina ، مرحبًا!" في الميكروفون
سيظهر المجلد الذي يحتوي على إعدادات الخيارات بعد الإطلاق الأول لـ Irina ، حيث يمكنك تصحيح الإعدادات.
المزيد من الخطوة -الخطوة infa حول التثبيت على الفوز (خاصة الفوز 7): docs/install_win.md
حل بعض المشكلات عند التثبيت تحت Linux: docs/install_linux.md
حل بعض المشكلات عند التثبيت تحت Macs: docs/install_mac.md
مبادئ التصحيح أثناء مشاكل التثبيت: docs/install_debug.md
يمكن كتابة الأخطاء في القضايا ، مناقشتها - في Telegram
C الإصدار 9.0 متاح مدير إعدادات الويب عبر Gradio.
لإطلاق ، ابدأ ملف Runva_settings_manager.py من المجلد الجذر.
إذا كنت ترغب في تشغيل كل شيء من خلال قفص الاتهام: docs/install_docker.md (هناك أيضًا أرصفة من Doker for Arm (Raspberries ، إلخ) من Ivan-Firefly)
إذا كنت تريد فقط مكونات مفاتيح معقدة ، فقم بتشغيلها من خلال قفص الاتهام: docs/install_docker_comp.md
يبدأ إطلاق جميع الفرق باسم مساعد (تم ضبطه في الخيارات/core.json ، افتراضيًا - إيرينا). يتم ذلك لاستبعاد الأعمال غير الصحيحة عند الاستماع المستمر إلى الميكروفون. سيتم وصفها بعد ذلك من قبل فرق بدون البادئة "Irina".
تم بناء دعم التحكم المحلي من خلال واجهة الويب بواسطة مشغل MPC-HC في المحرك ، لذلك يوصى باستخدامه. يمكن تكوينه في الخيارات/core.json
يتم دعم المكونات الإضافية على محرك jaa.py - محرك دعم محرك الولادة المفردة وإعداداته.
توجد المكونات الإضافية في مجلد الإضافات ويجب أن تبدأ ببادئة Plugins_.
توجد إعدادات الإضافات ، إن وجدت ، في مجلد الخيارات (تم إنشاؤها بعد الإطلاق الأول).
لكل مكون إضافي ، يتم كتابة ما إذا كان عبر الإنترنت مطلوبًا. إزالة لإيقاف تشغيل مجلد الإضافات
معلومات كاملة: docs/plugins.md
إذا كنت تريد أن تعرف:
زيارة: #1
(من الإصدار 10.0.0) لإطلاقه ، قم بتشغيل Runva_plugin_installer.py
الانتباه: يتم دعم المكونات الإضافية المقترحة من قبل المطورين الثالثين ويمكنهم استكمال وتغيير! مؤلف Irina غير مسؤول عن صيانتها!
للمطورين : إذا كنت ترغب في إضافة المكون الإضافي الخاص بك إلى هذه القائمة للتثبيت المبسط ، فستحتاج إلى القيام بما يلي:
مثال على تصميم البرنامج المساعد: https://github.com/janvarev/irene_plugin_boltalka2_openai
يوجد مكون إضافي جيد لجهة خارجية يتيح لك إطلاق البرامج النصية للمنزل من خلال Irina: https://github.com/timhok/ireneva-script-trigger-plugugin
من الأفضل مشاهدة إعدادات الإضافات المحددة في المكونات الإضافية
{
"contextDefaultDuration" : 10 , # Время в секундах, пока Ирина находится в контексте (контекст используется в непрерывном чате, играх и пр.; в контексте не надо использовать слово Ирина)
"contextRemoteWaitForCall" : false , # должна ли Ирина ждать от клиентов сингнала "Проигрывание ответа закончена, запускаем время для контекста?"
# официальные клиенты поддерживают contextRemoteWaitForCall, рекомендуется true
"fuzzyThreshold" : 0.5 , # (ПРО) Порог уверенности при использовании плагинов нечеткого распознавания команд
"isOnline" : true , # при установке в false будет выдавать заглушку на команды плагинов, требующих онлайн. Рекомендуется, если нужен только оффлайн.
"linguaFrancaLang" : "ru" , # язык для конвертации чисел в lingua-franca. Смените, если будете работать с другим языком
"logPolicy" : "cmd" , # all|cmd|none . Когда распознается речь с микрофона - выводить в консоль всегда | только, если является командой | никогда
"mpcHcPath" : "C: \ Program Files (x86) \ K-Lite Codec Pack \ MPC-HC64 \ mpc-hc64_nvo.exe" , # путь до MPC HC, если используете
"mpcIsUse" : true , # используется ли MPC HC?
"mpcIsUseHttpRemote" : true , # MPC HC - включено ли управление через веб-интерфейс?
"playWavEngineId" : "audioplayer" , # плагин проигрыша WAV-файлов. Некоторые WAV требуют sounddevice.
"replyNoCommandFound" : "Извини, я не поняла" , # ответ при непонимании
"replyNoCommandFoundInContext" : "Не поняла..." , # ответ при непонимании в состоянии контекста
"replyOnlineRequired" : "Нужен онлайн" , # ответ при вызове в оффлайн функции плагина, требующего онлайн
"tempDir" : "temp" , # папка для временных файлов
"ttsEngineId" : "pyttsx" , # используемый TTS-движок
"ttsEngineId2" : "" , # 2 используемый TTS-движок. Работает только на локальную озвучку - например, буфера обмена. Вызывается командой say2
"useTTSCache" : false , # при установке true в папке tts_cache будет кэшировать .wav файлы со сгенерированными TTS-движком ответами
"v" : "1.7" , # версия плагина core. Обновляется автоматически, не трогайте
"voiceAssNames" : "ирина|ирины|ирину" , # Если это появится в звуковом потоке, то дальше будет команда. (Различные имена помощника, рекомендуется несколько)
"voiceAssNameRunCmd" : { # если вы обратитесь к помощнику по этому имени, то в начало вашей команды будет подставлено соответствующее слово
"альбина" : "чатгпт"
}
}لتصحيح الأخطاء ، يمكنك استخدام إطلاق النظام من خلال ملف RunVA_CMDLINE.py .
إنها تصنع النواة ( Vacore in vacore.py ) من خلال واجهة سطر الأوامر ، وهذا أكثر ملاءمة من الإملاء بصوت.
وثائق التنمية
يعد التثبيت المتعدد في وضع "خادم العميل" أكثر تعقيدًا إلى حد ما ، ولكنه يسمح لك بإدارة إيرينا:
اقرأ المزيد عن إعدادات خادم العملاء
وثيقة ويب ويب واجهة برمجة تطبيقات
إذا كانت لديك مشاكل في تثبيت VOSK (على سبيل المثال ، على MAC) ، فيمكنك استخدام العمل من خلال خادم التعرف على خطاب VOSK Auto ، والذي يتم إطلاقه من خلال قفص الاتهام.
docker run -d -p 2700:2700 alphacep/kaldi-ru:latest (التفاصيل: https://alphacephei.com/vosk/server)vosk_asr_server.py ، مما يقلل من المعلمات في الداخل args . interface = os . environ . get ( 'VOSK_SERVER_INTERFACE' , "0.0.0.0" )
args . port = int ( os . environ . get ( 'VOSK_SERVER_PORT' , 2700 )runva_voskrem.py . سوف يقرأ البيانات من الميكروفون ويرسل إلى الخادم للتعرف. إذا كنت بحاجة إلى تشغيل التعرف على جهاز آخر -استخدم المعلمة -u ( -uri): runva_voskrem.py -u=ws://100.100.100.100:2700 لتوضيح عنوان الخادم.
PleaseRecognition - محرك كلاسيكي لإطلاقه بواسطة Google وعدد من الخدمات الأخرى. لبدء هذا التقدير ، ابدأ النظام من خلال ملف Runva_SpeecRecknition.py .
للعمل ، ستحتاج:
pip install PyAudio
pip install SpeechRecognition
إذا كانت هناك مشاكل في تثبيت Pyaudio ، فاقرأ التفاصيل من Enjirouz
الميزات: التعرف على الأرقام. يتم التعرف على نفس العبارة على النحو التالي:
لا يعني المشروع ككل دعمًا للمصطلحات متعددة اللغات ، لأنه يستخدم كلمات التحليل المخصصة في المكونات الإضافية. ولكن ، ومع ذلك ، فإن النواة ( vacore.py ) ليست مرتبطة تمامًا باللسان ، ويمكنك جمع التثبيت الخاص بك بلغة أخرى ، ما عليك سوى إعادة كتابة المكونات الإضافية لهم.
يتم إعداد العديد من عبارات اللغة التي تحدد السلوك الأساسي لمساعد اللغة (اسمه ، وكذلك عبارات مثل "لم أفهم") في ملف تكوين المكون الإضافي الأساسي .
C الإصدار 7.5 يدعم معالجة إدخال المستخدم الغامض.
لتعيين عتبة الاعتراف ، هناك معلمة عالمية fuzzythreshold في core.json ، فإنها تقبل القيم من 0 إلى 1 (1 - ثقة كاملة في العبارة)
المكونات الإضافية الشهيرة التي تعمل مع هذا:
من الإصدار 8.1 في وضع الاختبار ، تم تقديم دعم لـ Core-Plane من مساعد Vasya الصوتي: https://github.com/oknolaz/vasiSualy
للإضافة:
إنه يعمل في أبسط الحالات - تم اختباره على المكونات الإضافية للعملة المعدنية و Crystall_ball.
إذا لم ينجح ، اقرأ الكود. يتم تقديم الدعم من خلال البرنامج المساعد _vasi.py.
إذا كنت ترغب في إضافة شيء ما إلى المشروع ، فمن الجيد أن تتعرف على سياسة المساهمة
قصير:
enjirouz لمشروع المساعد الصوتي: https://github.com/enjirouz/voice-ssistant-app ، والذي أصبح الأساس (على الرغم من إعادة تصميمه للغاية)
Alphacephei for the Beautiful Condition Library Vosk (https://alphacephei.com/vosk/index.ru)
الصعوبة الرئيسية في OpenSors هي عدم كتابة رمز. كتابة الرمز مثيرة للاهتمام.
تتمثل الصعوبة في OpenSors في الحفاظ على الكود والمستخدمين لفترة طويلة.
أجب على الأسئلة. إصلاح الأخطاء. اكتب المقالات والوثائق.
إذا كنت ترغب في دعم اهتمامي وجعل Irina ، كمساعد صوتي مستقل عن الشركات الكبيرة ، يمكنك الدعم ، يمكنك: