
هذا المشروع الذي قام به Vincent KOC ينفذ نظام إجادة أسئلة قائم على الاسترجاع (RAG) للوثائق. يستخدم نماذج Llama 3 و Mistral و Gemini للاستدلال المحلي مع Llama C ++ و Langchain للتنسيق والكروماد لتخزين المتجهات والتدفق لواجهة المستخدم.

تأكد من تثبيت Python 3.9 : يمكنك استخدام pyenv :
pyenv install 3.9.16
pyenv local 3.9.16
pyenv rehash
إنشاء بيئة افتراضية وتثبيت التبعيات :
make setup
تنزيل النماذج : قم بتنزيل نماذج Llama 3 (8b) و Mistral (7b) بتنسيق GGUF ووضعها في models/ الدليل. شاركت TheBloke على الوجه المعانقة النماذج هنا:
كما تم اختبار النماذج من unsloth ويمكن العثور عليها هنا:
طراز محول الجملة QDrant : سيتم تنزيل هذا تلقائيًا في المدى الأول. إذا قامت تشغيل RAG Airgped محليًا ، فمن الأفضل تشغيل قاعدة البيانات مع الوصول إلى الإنترنت في البداية لتنزيل النموذج.
make run
make docker-build
make docker-run
اضبط الإعدادات في config.yaml لتعديل مسارات النموذج ، وأحجام القطع ، وغيرها من المعلمات.
المساهمات مرحب بها! يرجى تورك المستودع وتقديم طلب سحب. للتغييرات الرئيسية ، يرجى فتح مشكلة أولاً لمناقشة ما تريد تغييره.
تم ترخيص هذا المشروع بموجب ترخيص GNU العام الإصدار 3.0 (GPLV3). انظر ملف الترخيص للحصول على التفاصيل.
هذا يعنى:
لمزيد من المعلومات ، يرجى زيارة GNU GPL V3.