هذا هو مساعد صوت شخصي يمكنه أداء مهام مختلفة مثل تشغيل الموسيقى من YouTube ، وإصلاح الأخطاء ، والدردشة معك مثل chatbot العادية. تم تصميم المساعد باستخدام Python ويستفيد من العديد من المكتبات وواجهة برمجة التطبيقات لتوفير وظائفها.
شاهد الفيديو
عملية إصلاح الخطأ:
عندما يبلغ المستخدم عن خطأ ، يأخذ مساعد الصوت الشخصي لقطة شاشة للشاشة الحالية لالتقاط المشكلة الدقيقة. ثم تتم معالجة هذه الصورة باستخدام OpenCV لاستخراج النص من لقطة الشاشة. يتم إرسال النص المستخرج إلى نموذج لغة Llama 3 ، والذي يحلل المحتوى ويولد استجابة أو حلًا ذا صلة. يقوم المساعد بعد ذلك بإبلاغ الخطوات المقترحة أو استكشاف الأخطاء وإصلاحها إلى المستخدم ، مما يضمن عملية دقة مبسطة وفعالة.
تأكد من تثبيت Python على نظامك. يمكنك تنزيله من python.org.
استنساخ المستودع:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistantتثبيت الحزم المطلوبة:
pip install -r requirements.txt قم بإنشاء ملف .env في الدليل الجذر للمشروع وإضافة مفتاح Groq API الخاص بك:
GROQ_API_KEY = your_groq_api_key python main.py
يمكنك إضافة المزيد من الوظائف إلى المساعد من خلال قائمة استدعاء الوظائف. تعرف على المزيد حول استدعاء الوظيفة في دالة Openai في Datacamp.
يمكنك استخدام نفس الشيء ل meta llama3
يمكنك إضافة المزيد من الوظائف إلى المساعد من خلال قائمة استدعاء الوظائف. تعرف على المزيد حول استدعاء الوظيفة في دالة Openai في Datacamp.
لإضافة وظائف جديدة ، قم بتحديث function_calling_template في الكود:
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter تم ترخيص هذا المشروع بموجب ترخيص معهد ماساتشوستس للتكنولوجيا - راجع ملف الترخيص للحصول على التفاصيل.