Disha - Chatbot IIIT Nagpur
مرحبًا بك في مستودع Disha chatbot Github! هذا المشروع هو حل مبتكر مصمم لتبسيط تجربة المستخدم للتنقل في موقع IIIT Nagpur. تم تصميمه مع التعلم الآلي المتطرف (ML) ، ومعالجة اللغة الطبيعية (NLP) ، ونماذج اللغة الكبيرة (LLMS) ، ويوفر Disha استجابات فورية وسهلة الاستخدام لمجموعة متنوعة من الاستعلامات.
سمات
تفاعل يشبه الإنسان
- يتيح المحادثات الطبيعية وبديهية.
- يوفر إجابات دقيقة وسياقية للاستفسارات حول iiit nagpur.
مدخلات الصوت
معالجة البيانات والهيكلة
- يستخلص النص والصور من موقع IIIT Nagpur باستخدام OCR.
- تقوم بتكوين البيانات إلى تنسيق JSON شامل للتدريب.
ردود موحدة ودقيقة
- يجمع بين LLMs المضبوطة والجيل المسبق للاسترجاع (RAG) للحصول على إجابات دقيقة.
- يتم التحقق من الردود لتحقيق أقصى موثوقية.
مقاييس التقييم
- يقيس جودة الإخراج باستخدام Bleu و Rouge-L والتشابه الدلالي ومقاييس النتيجة البشرية.
التقنيات الرئيسية
نماذج التعلم الآلي
- Llama-3.2-1b : تم ضبطه مع قيم الترتيب R-8 و R-16 و R-32 و PHI-3.5.
- PHI-3.5-MINI
- تقنيات PEFT : صقل فعال مع Lora و Qlora.
الجيل المسبق للاسترجاع (خرقة)
- يسترجع البيانات الدقيقة ذات الصلة بالسياق من قواعد البيانات الخارجية.
- يستخدم:
- Pinecone : قاعدة بيانات المتجهات للبحث والاسترجاع المحسّن.
- Langchain : بالنسبة لخطوط أنابيب البيانات السلس.
- Google Gemini API : يوفر إجابات دقيقة وتلخيص.
جدول مقاييس التقييم
| نموذج | بلو | روج ل | التشابه الدلالي | التقييم البشري | المعلمات المدربة |
|---|
| llama-3.2-1b (ص = 8) | 0.925700 | 0.964550 | 0.998106 | 0.934744 | 12،156،928 |
| llama-3.2-1b (ص = 16) | 0.925950 | 0.964757 | 0.998106 | 0.942012 | 24،313،856 |
| llama-3.2-1b (ص = 32) | 0.924404 | 0.963656 | 0.998096 | 0.946338 | 48،627،712 |
| PHI 3.5 MINI | 0.785048 | 0.886750 | 0.998205 | 0.852504 | 29،884،416 |
| خرقة | 0.964902 | 0.996087 | 0.995800 | 0.967379 | 0 |
نماذج مدربة
- llama-3.2-1b r = 8 رابط
- llama-3.2-1b r = 16 رابط
- llama-3.2-1b r = 32 رابط
- رابط PHI-3.5-MINI
واجهة الويب - وجه المعانقة
نظرة عامة على الهندسة المعمارية
الذكاء الموحد
- يدمج RAC و LLMs المضبوطات للأداء القوي.
الحفاظ على السياق
- يضمن يتم تضمين جميع التفاصيل الهامة في الاستجابات.
التدفق الطبيعي
- يقدم تفاعلات محادثة سهلة الاستخدام.
خطط مستقبلية
- توسيع دعم اللغة وراء الهندية والإنجليزية.
- تعزيز قابلية التوسع لمجموعات البيانات الكبيرة والاستعلامات الأكثر تعقيدًا.
- دمج مقاييس التقييم الإضافية لتحسين الدقة.
لا تتردد في شوكة ، والمساهمة ، وتعزيز Disha للتطبيقات الأوسع!