Il s'agit d'un assistant vocal personnel qui peut effectuer diverses tâches telles que jouer de la musique à partir de YouTube, réparer les erreurs et discuter avec vous comme un chatbot normal. L'assistant est construit à l'aide de Python et exploite plusieurs bibliothèques et API pour fournir ses fonctionnalités.
Regardez la vidéo
Processus de fixation des erreurs:
Lorsqu'un utilisateur signale une erreur, l'assistant vocal personnel prend une capture d'écran de l'écran actuel pour saisir le problème exact. Cette image est ensuite traitée à l'aide d'OpenCV pour extraire le texte de la capture d'écran. Le texte extrait est envoyé au modèle de langue Llama 3, qui analyse le contenu et génère une réponse ou une solution pertinente. L'assistant communique ensuite le correctif suggéré ou le dépannage des étapes à l'utilisateur, assurant un processus de résolution rationalisé et efficace.
Assurez-vous que Python soit installé sur votre système. Vous pouvez le télécharger à partir de python.org.
Clone le référentiel:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-AssistantInstallez les packages requis:
pip install -r requirements.txt Créez un fichier .env dans le répertoire racine du projet et ajoutez votre touche API GROQ:
GROQ_API_KEY = your_groq_api_key python main.py
Vous pouvez ajouter plus de fonctionnalités à l'assistant via la liste des appels de fonction. En savoir plus sur l'appel de fonction sur le tutoriel d'appel de la fonction OpenAIA de DataCamp.
Vous pouvez utiliser la même chose pour Meta Llama3
Vous pouvez ajouter plus de fonctionnalités à l'assistant via la liste des appels de fonction. En savoir plus sur l'appel de fonction sur le tutoriel d'appel de la fonction OpenAIA de DataCamp.
Pour ajouter de nouvelles fonctions, mettez à jour la function_calling_template dans le code:
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter Ce projet est autorisé en vertu de la licence MIT - voir le fichier de licence pour plus de détails.