伊琳娜(Irina)是离线工作的俄罗斯语音助手。需要Python 3.5+(依赖性可能更少,但在任何情况下,Python 3)
支持插件(技能)。
有关Habri的文章|有关Habri的第二篇文章|有关Habri的第三篇文章|小组电报
通过Service vsegpt.ru,伊琳娜作者的另一个项目:
请访问https://github.com/janvarev/irene-va-win-installer,下载代码(代码/下载ZIP),然后按照说明进行操作。
安装后,将提供以下命令:“ Irina Hello”,“ Irina扔硬币”,“ Irina Tear the Cube”,“游戏较小”,“ Irina Time三分钟”
要准备或解决问题,请启动start-settings-manager.bat启动设置管理器,您可以完成插件并找出其他命令。
有关此选项的更多码头:docs/install_win_compact.md
安装后,离线团队将可用(因为这是默认配置)。示例:“ Irina Hello”,“ Irina Tear The Coin”,“ Irina Tear the Cube”,“ Irina游戏较小”,“ Irina Timer三分钟”
如何准备此选项:docs/install_win_compact.md
您将需要安装的Python(约3.7-3.11)。
要快速安装所有所需的依赖项,您可以使用命令: pip install -r requirements.txt (对于linux和macOS-首先安装AudioPlayer)
要开始开始,请从根文件夹运行runva_vosk.py文件。默认情况下,他将启动Vosk离线支持者,以识别麦克风的演讲,而PYTSX引擎则在此处向助手发出更多有关Pyttsx的助手。
开始后,您可以与一个简单的团队进行检查 - 说“ Irina,您好!”在麦克风中
带有选项设置的文件夹将出现在第一次启动之后,您可以在其中纠正设置。
有关Win(尤其是Win 7)安装的更多步骤-By -step Infa:doc/install_win.md
在Linux下安装时解决一些问题:docs/install_linux.md
在Macs下安装时解决一些问题:docs/install_mac.md
安装问题期间调试的原则:docs/install_debug.md
可以用问题写成错误 - 在电报中讨论
C版9.0可通过Gradio的可用Web设置管理器。
要启动,请从根文件夹启动runva_settings_manager.py文件。
如果您想通过码头运行所有内容:docs/install_docker.md(也有ivan-firefly的手臂doker dock for Arm(Raspberries等))
如果仅想要复杂的密钥组件,请贯穿码头:docs/install_docker_comp.md
所有团队的发布始于助手名称(默认情况下,以options/core.json进行调整-Irina)。这样做是为了排除不正确聆听麦克风时不正确的工作。接下来将由没有前缀“ Irina”的团队描述。
MPC-HC播放器通过Web界面对本地控制的支持已内置在引擎中,因此建议使用它。它可以在选项/core.json中配置
插件的支持是在JAA.PY引擎上进行的,这是简约的单文件引擎支持引擎及其设置。
插件位于插件文件夹中,应从插件前缀开始。
插件设置(如果有)位于“选项”文件夹中(在第一次启动之后创建)。
对于每个插件,是否需要在线。卸下以关闭插件文件夹
完整信息:文档/插件
如果您想知道:
访问:#1
(从版本10.0.0)要启动,请运行runva_plugin_installer.py
注意:拟议的插件由第三方开发人员支持,他们可以补充和更改!伊琳娜(Irina)的作者对维护不承担任何责任!
对于开发人员:如果要将插件添加到此列表中以进行简化的安装,则需要执行以下操作:
插件设计的示例:https://github.com/janvarev/irene_plugin_boltalka2_openai
有一个不错的第三方插件,可让您通过Irina启动家庭助理脚本:https://github.com/timhok/ireneva-script-script-trigger-pligger-plugugin
最好在插件中观看特定插件的设置
{
"contextDefaultDuration" : 10 , # Время в секундах, пока Ирина находится в контексте (контекст используется в непрерывном чате, играх и пр.; в контексте не надо использовать слово Ирина)
"contextRemoteWaitForCall" : false , # должна ли Ирина ждать от клиентов сингнала "Проигрывание ответа закончена, запускаем время для контекста?"
# официальные клиенты поддерживают contextRemoteWaitForCall, рекомендуется true
"fuzzyThreshold" : 0.5 , # (ПРО) Порог уверенности при использовании плагинов нечеткого распознавания команд
"isOnline" : true , # при установке в false будет выдавать заглушку на команды плагинов, требующих онлайн. Рекомендуется, если нужен только оффлайн.
"linguaFrancaLang" : "ru" , # язык для конвертации чисел в lingua-franca. Смените, если будете работать с другим языком
"logPolicy" : "cmd" , # all|cmd|none . Когда распознается речь с микрофона - выводить в консоль всегда | только, если является командой | никогда
"mpcHcPath" : "C: \ Program Files (x86) \ K-Lite Codec Pack \ MPC-HC64 \ mpc-hc64_nvo.exe" , # путь до MPC HC, если используете
"mpcIsUse" : true , # используется ли MPC HC?
"mpcIsUseHttpRemote" : true , # MPC HC - включено ли управление через веб-интерфейс?
"playWavEngineId" : "audioplayer" , # плагин проигрыша WAV-файлов. Некоторые WAV требуют sounddevice.
"replyNoCommandFound" : "Извини, я не поняла" , # ответ при непонимании
"replyNoCommandFoundInContext" : "Не поняла..." , # ответ при непонимании в состоянии контекста
"replyOnlineRequired" : "Нужен онлайн" , # ответ при вызове в оффлайн функции плагина, требующего онлайн
"tempDir" : "temp" , # папка для временных файлов
"ttsEngineId" : "pyttsx" , # используемый TTS-движок
"ttsEngineId2" : "" , # 2 используемый TTS-движок. Работает только на локальную озвучку - например, буфера обмена. Вызывается командой say2
"useTTSCache" : false , # при установке true в папке tts_cache будет кэшировать .wav файлы со сгенерированными TTS-движком ответами
"v" : "1.7" , # версия плагина core. Обновляется автоматически, не трогайте
"voiceAssNames" : "ирина|ирины|ирину" , # Если это появится в звуковом потоке, то дальше будет команда. (Различные имена помощника, рекомендуется несколько)
"voiceAssNameRunCmd" : { # если вы обратитесь к помощнику по этому имени, то в начало вашей команды будет подставлено соответствующее слово
"альбина" : "чатгпт"
}
}对于调试,您可以通过runva_cmdline.py文件使用系统启动。
她通过命令行界面制作核( vacore.py中的vacore ),这比在声音中指示更方便。
开发文档
“客户端服务器”模式中的多启动模式更为复杂,但允许您管理Irina:
阅读有关客户服务器设置的更多信息
Web API文档
如果您在VOSK安装方面遇到问题(例如,在Mac上),则可以通过通过码头启动的Vosk自动语音识别服务器使用该作品。
docker run -d -p 2700:2700 alphacep/kaldi-ru:latest (详细信息:https://alphacephei.com/vosk/server)vosk_asr_server.py ,减少内部参数 args . interface = os . environ . get ( 'VOSK_SERVER_INTERFACE' , "0.0.0.0" )
args . port = int ( os . environ . get ( 'VOSK_SERVER_PORT' , 2700 )runva_voskrem.py 。他将从麦克风中阅读数据,并发送到服务器以识别。如果您需要在另一台计算机上启动识别,请使用参数-U(-URI): runva_voskrem.py -u=ws://100.100.100.100:2700来澄清服务器的地址。
语音认可 - 由Google启动的经典引擎和许多其他服务。要启动此识别,请通过runva_speecrencognition.py文件启动系统。
对于工作,您将需要:
pip install PyAudio
pip install SpeechRecognition
如果安装Pyaudio有问题,请阅读Enjirouz的详细信息
特征:识别数字。相同的短语被认为如下:
整个项目并不意味着支持多语言术语,因为在插件中使用自定义解析单词。但是,但是,核( vacore.py )完全没有绑在舌头上,您可以用另一种语言收集自己的安装,只需为他们重写插件即可。
确定语言助手的核心行为的几种语言短语(他的名字,以及诸如“我不理解”之类的短语)是在核心插件配置文件中设置的。
C版本7.5支持模糊用户输入处理。
为了设置识别阈值,核心中有一个全局参数fuzzythreshold。
著名的插件与此合作:
从测试模式的8.1版中,从Vasya的语音助手那里获得了支持:https://github.com/oknolaz/vasisualy
添加:
它在最简单的情况下起作用 - 在硬币和Crystall_Ball插件上测试。
如果不起作用,请阅读代码。支持是通过插件plugin_vasi.py进行的。
如果您想在项目中添加一些东西,最好熟悉贡献。
短的:
@enjirouz进行语音助手的项目:https://github.com/enjirouz/voice-sistant-app,这成为基础(尽管已重新设计)
Alphacephei为美丽的识别库Vosk(https://alphacephei.com/vosk/index.ru)
打开器的主要困难不是编写代码。编写代码很有趣。
OPENS的困难是长时间维护代码和用户。
回答问题。修复错误。写文章和文档。
如果您想支持我的兴趣并使Irina成为独立于大公司的声乐助理,您可以支持:您可以: