伊琳娜(Irina)是離線工作的俄羅斯語音助手。需要Python 3.5+(依賴性可能更少,但在任何情況下,Python 3)
支持插件(技能)。
有關Habri的文章|有關Habri的第二篇文章|有關Habri的第三篇文章|小組電報
通過Service vsegpt.ru,伊琳娜作者的另一個項目:
請訪問https://github.com/janvarev/irene-va-win-installer,下載代碼(代碼/下載ZIP),然後按照說明進行操作。
安裝後,將提供以下命令:“ Irina Hello”,“ Irina扔硬幣”,“ Irina Tear the Cube”,“遊戲較小”,“ Irina Time三分鐘”
要準備或解決問題,請啟動start-settings-manager.bat啟動設置管理器,您可以完成插件並找出其他命令。
有關此選項的更多碼頭:docs/install_win_compact.md
安裝後,離線團隊將可用(因為這是默認配置)。示例:“ Irina Hello”,“ Irina Tear The Coin”,“ Irina Tear the Cube”,“ Irina遊戲較小”,“ Irina Timer三分鐘”
如何準備此選項:docs/install_win_compact.md
您將需要安裝的Python(約3.7-3.11)。
要快速安裝所有所需的依賴項,您可以使用命令: pip install -r requirements.txt (對於linux和macOS-首先安裝AudioPlayer)
要開始開始,請從根文件夾運行runva_vosk.py文件。默認情況下,他將啟動Vosk離線支持者,以識別麥克風的演講,而PYTSX引擎則在此處向助手發出更多有關Pyttsx的助手。
開始後,您可以與一個簡單的團隊進行檢查 - 說“ Irina,您好!”在麥克風中
帶有選項設置的文件夾將出現在第一次啟動之後,您可以在其中糾正設置。
有關Win(尤其是Win 7)安裝的更多步驟-By -step Infa:doc/install_win.md
在Linux下安裝時解決一些問題:docs/install_linux.md
在Macs下安裝時解決一些問題:docs/install_mac.md
安裝問題期間調試的原則:docs/install_debug.md
可以用問題寫成錯誤 - 在電報中討論
C版9.0可通過Gradio的可用Web設置管理器。
要啟動,請從根文件夾啟動runva_settings_manager.py文件。
如果您想通過碼頭運行所有內容:docs/install_docker.md(也有ivan-firefly的手臂doker dock for Arm(Raspberries等))
如果僅想要復雜的密鑰組件,請貫穿碼頭:docs/install_docker_comp.md
所有團隊的發布始於助手名稱(默認情況下,以options/core.json進行調整-Irina)。這樣做是為了排除不正確聆聽麥克風時不正確的工作。接下來將由沒有前綴“ Irina”的團隊描述。
MPC-HC播放器通過Web界面對本地控制的支持已內置在引擎中,因此建議使用它。它可以在選項/core.json中配置
插件的支持是在JAA.PY引擎上進行的,這是簡約的單文件引擎支持引擎及其設置。
插件位於插件文件夾中,應從插件前綴開始。
插件設置(如果有)位於“選項”文件夾中(在第一次啟動之後創建)。
對於每個插件,是否需要在線。卸下以關閉插件文件夾
完整信息:文檔/插件
如果您想知道:
訪問:#1
(從版本10.0.0)要啟動,請運行runva_plugin_installer.py
注意:擬議的插件由第三方開發人員支持,他們可以補充和更改!伊琳娜(Irina)的作者對維護不承擔任何責任!
對於開發人員:如果要將插件添加到此列表中以進行簡化的安裝,則需要執行以下操作:
插件設計的示例:https://github.com/janvarev/irene_plugin_boltalka2_openai
有一個不錯的第三方插件,可讓您通過Irina啟動家庭助理腳本:https://github.com/timhok/ireneva-script-script-trigger-pligger-plugugin
最好在插件中觀看特定插件的設置
{
"contextDefaultDuration" : 10 , # Время в секундах, пока Ирина находится в контексте (контекст используется в непрерывном чате, играх и пр.; в контексте не надо использовать слово Ирина)
"contextRemoteWaitForCall" : false , # должна ли Ирина ждать от клиентов сингнала "Проигрывание ответа закончена, запускаем время для контекста?"
# официальные клиенты поддерживают contextRemoteWaitForCall, рекомендуется true
"fuzzyThreshold" : 0.5 , # (ПРО) Порог уверенности при использовании плагинов нечеткого распознавания команд
"isOnline" : true , # при установке в false будет выдавать заглушку на команды плагинов, требующих онлайн. Рекомендуется, если нужен только оффлайн.
"linguaFrancaLang" : "ru" , # язык для конвертации чисел в lingua-franca. Смените, если будете работать с другим языком
"logPolicy" : "cmd" , # all|cmd|none . Когда распознается речь с микрофона - выводить в консоль всегда | только, если является командой | никогда
"mpcHcPath" : "C: \ Program Files (x86) \ K-Lite Codec Pack \ MPC-HC64 \ mpc-hc64_nvo.exe" , # путь до MPC HC, если используете
"mpcIsUse" : true , # используется ли MPC HC?
"mpcIsUseHttpRemote" : true , # MPC HC - включено ли управление через веб-интерфейс?
"playWavEngineId" : "audioplayer" , # плагин проигрыша WAV-файлов. Некоторые WAV требуют sounddevice.
"replyNoCommandFound" : "Извини, я не поняла" , # ответ при непонимании
"replyNoCommandFoundInContext" : "Не поняла..." , # ответ при непонимании в состоянии контекста
"replyOnlineRequired" : "Нужен онлайн" , # ответ при вызове в оффлайн функции плагина, требующего онлайн
"tempDir" : "temp" , # папка для временных файлов
"ttsEngineId" : "pyttsx" , # используемый TTS-движок
"ttsEngineId2" : "" , # 2 используемый TTS-движок. Работает только на локальную озвучку - например, буфера обмена. Вызывается командой say2
"useTTSCache" : false , # при установке true в папке tts_cache будет кэшировать .wav файлы со сгенерированными TTS-движком ответами
"v" : "1.7" , # версия плагина core. Обновляется автоматически, не трогайте
"voiceAssNames" : "ирина|ирины|ирину" , # Если это появится в звуковом потоке, то дальше будет команда. (Различные имена помощника, рекомендуется несколько)
"voiceAssNameRunCmd" : { # если вы обратитесь к помощнику по этому имени, то в начало вашей команды будет подставлено соответствующее слово
"альбина" : "чатгпт"
}
}對於調試,您可以通過runva_cmdline.py文件使用系統啟動。
她通過命令行界面製作核( vacore.py中的vacore ),這比在聲音中指示更方便。
開發文檔
“客戶端服務器”模式中的多啟動模式更為複雜,但允許您管理Irina:
閱讀有關客戶服務器設置的更多信息
Web API文檔
如果您在VOSK安裝方面遇到問題(例如,在Mac上),則可以通過通過碼頭啟動的Vosk自動語音識別服務器使用該作品。
docker run -d -p 2700:2700 alphacep/kaldi-ru:latest (詳細信息:https://alphacephei.com/vosk/server)vosk_asr_server.py ,減少內部參數 args . interface = os . environ . get ( 'VOSK_SERVER_INTERFACE' , "0.0.0.0" )
args . port = int ( os . environ . get ( 'VOSK_SERVER_PORT' , 2700 )runva_voskrem.py 。他將從麥克風中閱讀數據,並發送到服務器以識別。如果您需要在另一台計算機上啟動識別,請使用參數-U(-URI): runva_voskrem.py -u=ws://100.100.100.100:2700來澄清服務器的地址。
語音認可 - 由Google啟動的經典引擎和許多其他服務。要啟動此識別,請通過runva_speecrencognition.py文件啟動系統。
對於工作,您將需要:
pip install PyAudio
pip install SpeechRecognition
如果安裝Pyaudio有問題,請閱讀Enjirouz的詳細信息
特徵:識別數字。相同的短語被認為如下:
整個項目並不意味著支持多語言術語,因為在插件中使用自定義解析單詞。但是,但是,核( vacore.py )完全沒有綁在舌頭上,您可以用另一種語言收集自己的安裝,只需為他們重寫插件即可。
確定語言助手的核心行為的幾種語言短語(他的名字,以及諸如“我不理解”之類的短語)是在核心插件配置文件中設置的。
C版本7.5支持模糊用戶輸入處理。
為了設置識別閾值,核心中有一個全局參數fuzzythreshold。
著名的插件與此合作:
從測試模式的8.1版中,從Vasya的語音助手那裡獲得了支持:https://github.com/oknolaz/vasisualy
添加:
它在最簡單的情況下起作用 - 在硬幣和Crystall_Ball插件上測試。
如果不起作用,請閱讀代碼。支持是通過插件plugin_vasi.py進行的。
如果您想在項目中添加一些東西,最好熟悉貢獻。
短的:
@enjirouz進行語音助手的項目:https://github.com/enjirouz/voice-sistant-app,這成為基礎(儘管已重新設計)
Alphacephei為美麗的識別庫Vosk(https://alphacephei.com/vosk/index.ru)
打開器的主要困難不是編寫代碼。編寫代碼很有趣。
OPENS的困難是長時間維護代碼和用戶。
回答問題。修復錯誤。寫文章和文檔。
如果您想支持我的興趣並使Irina成為獨立於大公司的聲樂助理,您可以支持:您可以: