Personal Voice Assistant Using LLM FunctionCalling
1.0.0
这是一个个人语音助手,可以执行各种任务,例如从YouTube播放音乐,修复错误以及像普通聊天机器人一样与您聊天。助手是使用Python构建的,并利用了几个库和API来提供其功能。
观看视频
错误修复过程:
当用户报告错误时,个人语音助手会屏幕截图当前屏幕以捕获确切的问题。然后,使用OpenCV处理此图像以从屏幕截图中提取文本。提取的文本发送到Llama 3语言模型,该模型分析内容并生成相关的响应或解决方案。然后,助手将建议的修复程序或故障排除步骤返回给用户,以确保简化有效的分辨率流程。
确保系统上安装了Python。您可以从python.org下载它。
克隆存储库:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistant安装所需的软件包:
pip install -r requirements.txt在项目的根目录中创建.env文件,并添加您的GROQ API密钥:
GROQ_API_KEY = your_groq_api_key python main.py
您可以通过功能调用列表向助手添加更多功能。在Datacamp的OpenAI函数调用教程中了解有关函数调用的更多信息。
您可以将其用于Meta Llama3
您可以通过功能调用列表向助手添加更多功能。在Datacamp的OpenAI函数调用教程中了解有关函数调用的更多信息。
要添加新功能,请在代码中更新function_calling_template :
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter 该项目是根据MIT许可证获得许可的 - 有关详细信息,请参见许可证文件。