Personal Voice Assistant Using LLM FunctionCalling
1.0.0
這是一個個人語音助手,可以執行各種任務,例如從YouTube播放音樂,修復錯誤以及像普通聊天機器人一樣與您聊天。助手是使用Python構建的,並利用了幾個庫和API來提供其功能。
觀看視頻
錯誤修復過程:
當用戶報告錯誤時,個人語音助手會屏幕截圖當前屏幕以捕獲確切的問題。然後,使用OpenCV處理此圖像以從屏幕截圖中提取文本。提取的文本發送到Llama 3語言模型,該模型分析內容並生成相關的響應或解決方案。然後,助手將建議的修復程序或故障排除步驟返回給用戶,以確保簡化有效的分辨率流程。
確保系統上安裝了Python。您可以從python.org下載它。
克隆存儲庫:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistant安裝所需的軟件包:
pip install -r requirements.txt在項目的根目錄中創建.env文件,並添加您的GROQ API密鑰:
GROQ_API_KEY = your_groq_api_key python main.py
您可以通過功能調用列表向助手添加更多功能。在Datacamp的OpenAI函數調用教程中了解有關函數調用的更多信息。
您可以將其用於Meta Llama3
您可以通過功能調用列表向助手添加更多功能。在Datacamp的OpenAI函數調用教程中了解有關函數調用的更多信息。
要添加新功能,請在代碼中更新function_calling_template :
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter 該項目是根據MIT許可證獲得許可的 - 有關詳細信息,請參見許可證文件。