Rag-nificent: AI chatbot مدعوم من LLMs للاستشهاد بملفات PDF المخصصة والتقارير والمبادئ التوجيهية
الآن يدعم llama-3.1 بواسطة meta ai

Rag-nificent هو مستودع أحدث ما يعزز من قوة الجيل المتمثل في الاسترداد (RAG) لتوفير إجابات ومراجع فورية من دليل منسق PDF الذي يحتوي على معلومات حول أي موضوع معين مثل مستندات التوصيات منظمة الصحة العالمية. تم تصميم هذا النظام لمساعدة الباحثين وصانعي السياسات والجمهور في العثور بسرعة على معلومات محددة ضمن وثائق شاملة.
سمات
- واجهة المحادثة : التعامل مع النظام باستخدام استعلامات اللغة الطبيعية لتلقي الاستجابات التي يتم الحصول عليها مباشرة من PDFs.
- الاقتباس المباشر : تتضمن كل استجابة من النظام رابطًا مباشرًا لصفحة PDF المصدر ، مما يضمن التتبع والتحقق.
- دليل PDF : مجموعة محددة مسبقًا من وثائق PDF الرئيسية ، بما في ذلك توصيات منظمة الصحة العالمية بشأن مواضيع صحية كبرى مثل البلهارسيا والملاريا.
النماذج المتاحة
- ؟ LLAMA-33.1-8B ثابتة : تجربة استجابات فورية وفعالة مع هذا النموذج مُحسّن للتفاعلات السريعة.
- ؟ LLAMA-33.1-70B-العاكس : استخدم هذا النموذج متعدد الاستخدامات لمجموعة واسعة من المهام اللغوية المعقدة ذات الدقة العالية.
- GPT-3.5 توربو : التواصل مع التفاعلات المتقدمة التي تشبه الإنسان مناسبة لمهام المحادثة المتنوعة.
- ؟ LLAMA3-70B-8192 : استمتع بالأداء الراقي مع هذا النموذج على نطاق واسع ، وهو مثالي لرؤى التعلم العميق.
- ؟ LLAMA3-8B-8192 : تسخير إمكانات قوية مع هذا الإصدار الذي يمكن الوصول إليه أكثر من LLAMA3 ، وهو مثالي لمجموعة واسعة من تطبيقات الذكاء الاصطناعي.
- ؟ Mixtral-8x7B-32768 : الاستفادة من قوة نمذجة المجموعة مع قدرة Mixtral واسعة النطاق للتفاهم الدقيق وتوليد الاستجابة.
- ؟ GEMMA-7B-IT : استكشاف التفاعلات المتخصصة والحلول التي تركز على التكنولوجيا مع GEMMA ، المصممة لتكنولوجيا المعلومات والمحتوى الفني.
العرض التوضيحي

كيف تعمل
يستخدم التطبيق مزيجًا من التضمينات Openai ، والبحث عن متجه Pinecone ، وواجهة محادثة لتوفير تجربة استرجاع سلسة. عند إجراء استعلام ، النظام:
- يحول الاستعلام إلى تضمينات.
- يبحث عن أقسام المستندات الأكثر صلة باستخدام بحث ناقل Pinecone.
- إرجاع الإجابة مع الاستشهادات والروابط إلى مستندات المصدر.
يثبت
استنساخ المستودع:
git clone https://github.com/yourusername/RAG-nificent.git
تثبيت التبعيات:
pip install -r requirements.txt
تعيين متغيرات البيئة في .env (انظر أيضًا ملف .env.example :
-
PINECONE_INDEX_NAME -
PINECONE_NAME_SPACE -
OPENAI_API_KEY -
PINECONE_API_KEY -
GROQ_API_KEY
قم بإنشاء فهرس Pinecone بنفس اسم PINECONE_INDEX_NAME . قم بإعداده dimensions=1536 و metric=cosine .
ضع ملفات PDF الخاصة بك في دليل pdf_data وقم بتشغيل data_ingestion.py
تشغيل التطبيق:
مستندات المصدر
يتضمن النظام حاليًا إرشادات من ملفات PDF التالية مع روابط مباشرة إلى المستندات:
- منظمة الصحة العالمية المبدأ التوجيهي للسيطرة والقضاء على البلهارسيا البشرية (2022)
- إرشادات منظمة الصحة العالمية للملاريا (2023)