Téléchargement Irene Voice Assistant - Téléchargement du code source Irene Voice Assistant

Irene Voice Assistant

Code Source AI

v8.1

Télécharger

Assistant vocal Irina

Irina est une assistante vocale russe pour le travail hors ligne. Nécessite Python 3.5+ (la dépendance peut être moins, mais en tout cas Python 3)

Soutient les plugins (compétences).

Article sur Habri | Le deuxième article sur Habri | Le troisième article sur Habri | Groupe en télégramme

Via le service vsegpt.ru, un autre projet de l'auteur d'Irina:

Prend en charge la communication avec Chatgpt, GPT-4, Claude 3.
Prend en charge la réception des informations de référence sur Internet (certificat d'équipe) en utilisant des modèles spéciaux de perplexité en ligne.
Prend en charge OpenAI TTS (si difficile à définir quelque chose localement) (instructions pour régler le plugin). (Vous pouvez également utiliser n'importe quel point de terminaison compatible openai)

L'installation la plus rapide sous Windows

Allez sur https://github.com/janvarev/irene-va-win-installer, téléchargez le code (code / téléchargement zip) et suivez les instructions.

Après l'installation, les commandes suivantes seront disponibles: «Irina Hello», «Irina Tear the Coin», «Irina Tear the Cube», «Irina le jeu est plus grand», «Irina Timer trois minutes»

Pour préparer ou résoudre des problèmes, commencez à start-settings-manager.bat pour démarrer le gestionnaire de paramètres, vous pouvez terminer les plugins et trouver des commandes supplémentaires.

Plus de quais pour lier cette option: docs / install_win_compact.md

L'installation la plus rapide sous Windows 2 (obsolète)

Allez dans les sorties: https://github.com/janvarev/irene-voice-assistant/releases
Téléchargez la version et suivez les instructions. Python et Git sont dans le communiqué, rien ne doit être mis.

Après l'installation, des équipes hors ligne seront disponibles (car il s'agit d'une configuration par défaut). Exemple: "Irina Hello", "Irina Tear the Coin", "Irina Tear the Cube", "Irina Le jeu est plus petit", "Irina Timer trois minutes"

Comment préparer cette option: docs / install_win_compact.md

Installation / démarrage rapide

Vous aurez besoin du python installé (environ 3,7-3.11).

Pour installer rapidement toutes les dépendances requises, vous pouvez utiliser la commande: pip install -r requirements.txt (pour linux et macOS - premier installation packages pour AudioPlayer)
Pour commencer à commencer, exécutez le fichier runva_vosk.py dans le dossier racine. Par défaut, il lancera Vosk Offline Supporter pour reconnaître la parole avec un microphone et le moteur PYTSX pour exprimer un assistant davantage sur PYTTSX ici.
Après avoir commencé, vous pouvez vérifier avec une équipe simple - dire "Irina, bonjour!" Dans le microphone

Le dossier avec les paramètres d'options apparaîtra après le premier lancement d'Irina, vous pouvez corriger les paramètres.

Plus d'étape -By -Trep Infa sur l'installation sur Win (en particulier Win 7): Docs / Install_win.md

Résoudre certains problèmes lors de l'installation sous Linux: Docs / Install_linux.md

Résoudre certains problèmes lors de l'installation sous Mac: Docs / Install_mac.md

Les principes de débogage lors des problèmes d'installation: docs / install_debug.md

Les bogues peuvent être écrits en questions, discutées - en télégramme

Gestionnaire des paramètres

C version 9.0 Gestionnaire de paramètres Web disponibles via Gradio.

Pour lancer, démarrez le fichier runva_settings_manager.py dans le dossier racine.

Installation via un quai

Si vous souhaitez tout exécuter via un quai: docs / install_docker.md (il y a aussi des quais du Doker pour ARM (framboises, etc.) d'Ivan-Firefly)

Si vous ne voulez que des composants clés complexes, exécutez le dock: docs / install_docker_comp.md

Logique générale

Le lancement de toutes les équipes commence par le nom de l'assistant (réglé dans Options / Core.json, par défaut - Irina). Ceci est fait pour exclure des œuvres incorrectes lorsqu'il est constant en écoutant constant le microphone. Ensuite, sera décrit par les équipes sans le préfixe "Irina".

La prise en charge du contrôle local via l'interface Web par le lecteur MPC-HC est intégrée au moteur, il est donc recommandé de l'utiliser. Il peut être configuré dans Options / Core.json

Plugins

La prise en charge des plugins est fabriquée sur le moteur Jaa.py - le moteur de support moteur à fichier unique minimaliste et leurs paramètres.

Les plugins sont situés dans le dossier des plugins et doivent commencer par le préfixe Plugins_.

Les paramètres des plugins, le cas échéant, sont situés dans le dossier Options (créé après le premier lancement).

Plugins / compétences prêts (déjà dans le dossier des plugins)

Pour chaque plugin, il est écrit si en ligne est nécessaire. Retirer pour éteindre le dossier des plugins

Informations complètes: docs / plugins.md

Troisième plugins

Si vous voulez savoir:

Quels autres plugins des autres développeurs sont là
Publiez un lien vers votre plugin fait

Visite: # 1

Manager de plugin

(À partir de la version 10.0.0) Pour le lancement, exécutez runva_plugin_installer.py

ATTENTION: Les plugins proposés sont pris en charge par des développeurs de troisième partie et ils peuvent compléter et changer! L'auteur d'Irina n'est pas responsable de leur entretien!

Pour les développeurs : si vous souhaitez ajouter votre plugin à cette liste pour une installation simplifiée, vous devrez effectuer ce qui suit:

Placer le plugin sur le Githabe
Les fichiers de type plugin_x.py devraient fondamentalement. Il peut y en avoir plusieurs
Si vous avez besoin d'installer des modules supplémentaires, le fichier requements.txt doit mentir
Testez la possibilité d'installer en lançant Runva_plugin_installer, en sélectionnant le paragraphe 0 (définissez indépendamment l'adresse du projet GitHub avec le plugin) et définissez votre plugin
Après tout, contestez votre lien pour émettre ou effectuez une demande de traction en modifiant les plugins_catalog.json, qui contient des liens vers des dopplagines bien connues.

Exemple de la conception du plugin: https://github.com/janvarev/irene_plugin_boltalka2_openai

Intégration avec l'assistant à domicile

Il y a un bon plugin tiers qui vous permet de lancer des scripts d'assistant à domicile via Irina: https://github.com/timhok/ireneva-script-crigger-plugugin

Paramètres nucléaires (Core.json)

Les paramètres de plugins spécifiques sont mieux surveillés dans les plugins

{
    "contextDefaultDuration" : 10 , # Время в секундах, пока Ирина находится в контексте (контекст используется в непрерывном чате, играх и пр.; в контексте не надо использовать слово Ирина)
    "contextRemoteWaitForCall" : false , # должна ли Ирина ждать от клиентов сингнала "Проигрывание ответа закончена, запускаем время для контекста?"
    # официальные клиенты поддерживают contextRemoteWaitForCall, рекомендуется true
    "fuzzyThreshold" : 0.5 , # (ПРО) Порог уверенности при использовании плагинов нечеткого распознавания команд
    "isOnline" : true , # при установке в false будет выдавать заглушку на команды плагинов, требующих онлайн. Рекомендуется, если нужен только оффлайн.
    "linguaFrancaLang" : "ru" , # язык для конвертации чисел в lingua-franca. Смените, если будете работать с другим языком
    "logPolicy" : "cmd" , # all|cmd|none . Когда распознается речь с микрофона - выводить в консоль всегда | только, если является командой | никогда
    "mpcHcPath" : "C: \ Program Files (x86) \ K-Lite Codec Pack \ MPC-HC64 \ mpc-hc64_nvo.exe" , # путь до MPC HC, если используете
    "mpcIsUse" : true , # используется ли MPC HC?
    "mpcIsUseHttpRemote" : true , # MPC HC - включено ли управление через веб-интерфейс?
    "playWavEngineId" : "audioplayer" , # плагин проигрыша WAV-файлов. Некоторые WAV требуют sounddevice.
    "replyNoCommandFound" : "Извини, я не поняла" , # ответ при непонимании
    "replyNoCommandFoundInContext" : "Не поняла..." , # ответ при непонимании в состоянии контекста
    "replyOnlineRequired" : "Нужен онлайн" , # ответ при вызове в оффлайн функции плагина, требующего онлайн 
    "tempDir" : "temp" , # папка для временных файлов
    "ttsEngineId" : "pyttsx" , # используемый TTS-движок
    "ttsEngineId2" : "" , # 2 используемый TTS-движок. Работает только на локальную озвучку - например, буфера обмена. Вызывается командой say2
    "useTTSCache" : false , # при установке true в папке tts_cache будет кэшировать .wav файлы со сгенерированными TTS-движком ответами
    "v" : "1.7" , # версия плагина core. Обновляется автоматически, не трогайте
    "voiceAssNames" : "ирина|ирины|ирину" , # Если это появится в звуковом потоке, то дальше будет команда. (Различные имена помощника, рекомендуется несколько)
    "voiceAssNameRunCmd" : { # если вы обратитесь к помощнику по этому имени, то в начало вашей команды будет подставлено соответствующее слово
        "альбина" : "чатгпт"
    }
}

Débogage et développement (pour les développeurs)

Pour le débogage, vous pouvez utiliser le lancement du système via le fichier runva_cmdline.py .

Elle fait le noyau ( vacore dans vacore.py ) via l'interface de ligne de commande, ceci est plus pratique que de dicter une voix.

Vous pouvez connecter vos propres compétences en créant un plugin dans Plugins_ . Voir des exemples.
Vous pouvez connecter votre propre TTS avec un plugin. À titre d'exemples, voir plugins_tts_console.py, plugins_tts_pyttsx.py.
De plus, en créant votre propre fichier runva_ , vous pouvez, si vous le souhaitez, connecter le moteur de parole à texte.

Développement de plugins

Documentation de développement

Travail à distance (installations de serveur-client, multimicrophone / machine)

La multi-installation du mode "client-serveur" est un peu plus compliquée, mais vous permet de gérer Irina:

de plusieurs microphones
de différentes voitures
De Telegram (en utilisant Telegram Botto)

En savoir plus sur les paramètres du serveur client

Documentation de l'API Web

Speech-to-Text via Vosk Remote

Si vous avez des problèmes avec l'installation de VOSK (par exemple, sur Mac), vous pouvez utiliser le travail via le serveur de reconnaissance vosk Auto Speech, qui est lancé via le quai.

Lancement docker run -d -p 2700:2700 alphacep/kaldi-ru:latest (Détails: https://alphacephei.com/vosk/server)
- ou en option, vous pouvez exécuter vosk_asr_server.py , réduisant les paramètres à l'intérieur

    args . interface = os . environ . get ( 'VOSK_SERVER_INTERFACE' , "0.0.0.0" )
    args . port = int ( os . environ . get ( 'VOSK_SERVER_PORT' , 2700 )

Lancez runva_voskrem.py . Il lira les données du microphone et enverra le serveur pour reconnaissance.

Si vous devez lancer la reconnaissance sur une autre machine, utilisez le paramètre -u (--uri): runva_voskrem.py -u=ws://100.100.100.100:2700 pour clarifier l'adresse du serveur.

Discours à texte via la reconnaissance de la parole

SpeechRecognition - Un moteur classique pour le lancement par Google et un certain nombre d'autres services. Pour lancer cette reconnaissance, démarrez le système via le fichier runva_speeconcognition.py .

Pour le travail, vous aurez besoin:

pip install PyAudio

pip install SpeechRecognition

S'il y a des problèmes avec l'installation de Pyaudio, lisez les détails d'Enjirouz

Caractéristiques: Reconnaissance des chiffres. La même phrase est reconnue comme suit:

VOSK: Timer dix secondes
SpeechRecognition (Google): temporisateur 10 secondes

Prise en charge des termes multilingues

Le projet dans son ensemble n'implique pas la prise en charge des termes multilingues, car utilise des mots d'analyse personnalisés dans les plugins. Mais, néanmoins, le noyau ( vacore.py ) n'est pas complètement lié à la langue, et vous pouvez collecter votre propre installation dans une autre langue, en réécrivant simplement les plugins pour eux.

Plusieurs phrases linguistiques qui déterminent le core-comportement de l'assistant linguistique (son nom, ainsi que des phrases comme "Je n'ai pas compris") sont configurées dans le fichier de configuration du plugin de base .

Traitement flou des phrases

C La version 7.5 prend en charge le traitement des entrées utilisateur floue.

Pour définir le seuil de reconnaissance, il y a un paramètre global Fuzzythreshold dans Core.json, il accepte les valeurs de 0 à 1 (1 - une confiance complète dans la phrase)

Plugins célèbres travaillant avec ceci:

https://github.com/janvarev/irene_plugin_fuzzzy_thefuzz - à travers lefuzz, comparaison floue des lignes
https://github.com/modos189/irene_plugin_fuzzy_sklearn - via Scikit-learn
https://github.com/janvarev/irene_plugin_fuzzy_ai_sence - comparaison sémantique des lignes sur les réseaux de neurones (phrase_transorgers)

Plugins de l'assistant vocal de Vasisual

De la version 8.1 en mode test, la prise en charge du plan de base de l'assistant vocal de Vasya a été fabriquée: https://github.com/oknolaz/vasisualy

Pour ajouter:

Les plugins doivent être lancés dans les plugins_vasi / compétences (apportez-le à https://github.com/oknolaz/vasisualy/tree/master/vasisualy/skills)
À partir de chaque plugin, il est prévu que les déclencheurs soient énoncés dans le module, sur la base de laquelle une liste de commandes est formée. Sinon, le plugin doit être finalisé.

Il fonctionne dans les cas les plus simples - testés sur les plugins Coin et Crystal_Ball.

Si cela ne fonctionne pas, lisez le code. La prise en charge est effectuée via le plugin plugin_vasi.py.

Contributif

Si vous souhaitez ajouter quelque chose au projet, il est bon de vous familiariser avec la politique contribution.md

Court:

Il est conseillé aux plugins de réaliser des projets GitHub séparés (ou de les placer ailleurs) que vous êtes prêt à soutenir. Les liens peuvent être lancés dans le n ° 1 afin que d'autres trouvent votre plugin. Il n'est pas nécessaire de jeter des plugins supplémentaires dans ce projet - je n'ai pas de temps et de force pour soutenir ce que je ne comprends pas.
Faire des changements de points qui améliorent les fonctionnalités ou les bugs de la ciblage (par exemple, l'inexplicabilité dans certaines conditions). Une telle demande de traction avec une forte probabilité sera acceptée.
Les modifications de code de masse (apportant le style de code en un seul, l'organisation des importations) ne sera pas considérée et sera rejetée . Veuillez ne pas les faire.

Gratitude

@Enjirouz pour le projet de l'assistant vocal: https://github.com/enjirouz/voice-ssistant-app, qui est devenu la base (bien qu'il ait été très repensé)

Alphacephei pour la belle bibliothèque de reconnaissance Vosk (https://alphacephei.com/vosk/index.ru)

Soutien au projet

La principale difficulté d'Openseurs n'est pas d'écrire un code. Écrire le code est intéressant.

La difficulté d'Opensors est de maintenir le code et les utilisateurs pendant longtemps.

Répondre aux questions. Correction des bogues. Écrivez des articles et de la documentation.

Si vous souhaitez soutenir mon intérêt et faire d'Irina, en tant qu'assistant vocal indépendant des grandes entreprises, vous pouvez soutenir, vous pouvez:

Écrivez un nouveau plugin (ça me plaît toujours!)
Jetez l'argent par un abonnement sur https://boosty.to/irene-voice, plus les abonnés ont, mieux je comprends que le projet est nécessaire.
Parlez à quelqu'un d'Irina ou aidez-vous à la configurer.
Dites simplement "merci" dans cette branche: # 12

Développer

Informations supplémentaires

Version v8.1
Type Code Source AI
Date de mise à jour 2025-08-23
taille 90.68MB
Provenant de Github

Applications connexes

GLM 4 Voice

2024-11-02
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
HLS Assistant Film et TV Édition gratuite

2023-12-06
Application Assistant T

2023-08-18
Interface SMS illimitée GOOGLE VOICE

2009-11-07

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout