นี่คือผู้ช่วยเสียงส่วนบุคคลที่สามารถทำงานต่าง ๆ เช่นการเล่นเพลงจาก YouTube แก้ไขข้อผิดพลาดและสนทนากับคุณเช่น Chatbot ปกติ ผู้ช่วยถูกสร้างขึ้นโดยใช้ Python และใช้ประโยชน์จากห้องสมุดและ API หลายแห่งเพื่อให้การทำงาน
ดูวิดีโอ
กระบวนการแก้ไขข้อผิดพลาด:
เมื่อผู้ใช้รายงานข้อผิดพลาดผู้ช่วยเสียงส่วนบุคคลจะใช้ภาพหน้าจอของหน้าจอปัจจุบันเพื่อจับปัญหาที่แน่นอน ภาพนี้จะถูกประมวลผลโดยใช้ OpENCV เพื่อแยกข้อความออกจากภาพหน้าจอ ข้อความที่สกัดถูกส่งไปยังรูปแบบภาษา Llama 3 ซึ่งวิเคราะห์เนื้อหาและสร้างการตอบสนองหรือวิธีแก้ปัญหาที่เกี่ยวข้อง จากนั้นผู้ช่วยสื่อสารการแก้ไขที่แนะนำหรือการแก้ไขปัญหาขั้นตอนกลับไปยังผู้ใช้เพื่อให้มั่นใจว่ากระบวนการแก้ไขปัญหาที่มีประสิทธิภาพและมีประสิทธิภาพ
ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Python ในระบบของคุณแล้ว คุณสามารถดาวน์โหลดได้จาก python.org
โคลนที่เก็บ:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistantติดตั้งแพ็คเกจที่ต้องการ:
pip install -r requirements.txt สร้างไฟล์ .env ในไดเรกทอรีรูทของโครงการและเพิ่มคีย์ Groq API ของคุณ:
GROQ_API_KEY = your_groq_api_key python main.py
คุณสามารถเพิ่มฟังก์ชั่นเพิ่มเติมให้กับผู้ช่วยผ่านรายการเรียกใช้ฟังก์ชั่น เรียนรู้เพิ่มเติมเกี่ยวกับฟังก์ชั่นการโทรที่ฟังก์ชั่นการเรียกใช้ฟังก์ชั่นการเรียกใช้ฟังก์ชั่นการโทร
คุณสามารถใช้สิ่งเดียวกันสำหรับ meta llama3
คุณสามารถเพิ่มฟังก์ชั่นเพิ่มเติมให้กับผู้ช่วยผ่านรายการเรียกใช้ฟังก์ชั่น เรียนรู้เพิ่มเติมเกี่ยวกับฟังก์ชั่นการโทรที่ฟังก์ชั่นการเรียกใช้ฟังก์ชั่นการเรียกใช้ฟังก์ชั่นการโทร
หากต้องการเพิ่มฟังก์ชั่นใหม่ให้อัปเดต function_calling_template ในรหัส:
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT - ดูไฟล์ใบอนุญาตสำหรับรายละเอียด