ينفذ هذا المشروع نظام إجابة (QA) لوثائق CUDA. يزحف وثائق NVIDIA CUDA ، ويعالج البيانات ، ويخزنها في قاعدة بيانات المتجهات ، ويستخدم تقنيات استرجاع متقدمة للإجابة على استعلامات المستخدم.
التبعيات الرئيسية لهذا المشروع هي:
للحصول على قائمة كاملة من التبعيات ، راجع ملف requirements.txt .
تأكد من تشغيل خادم Milvus. ارجع إلى وثائق Milvus للتثبيت وإعداد تعليمات الإعداد.
قم بتشغيل البرنامج النصي الرئيسي: 3. سيبدأ النظام عن طريق تزحف وثائق CUDA ومعالجة البيانات وتخزينها في قاعدة بيانات Milvus. قد يستغرق هذا الإعداد الأولي بعض الوقت.
بمجرد اكتمال الإعداد ، يمكنك البدء في طرح أسئلة حول CUDA. سيقدم النظام إجابات بناءً على المعلومات التي تم استردادها.
للخروج من النظام ، اكتب "الإقلاع" عند المطالبة بسؤال.
main.py : البرنامج النصي الرئيسي الذي ينظم العملية بأكملها.crawler/web_crawler.py : يحتوي على منطق زحف الويب.data_processing/chunking.py : تنفذ تقنيات تقطيع البيانات المتقدمة.data_processing/embedding.py : يتعامل مع إنشاء التضمينات المتجهات.vector_db/milvus_db.py : يدير التفاعلات مع قاعدة بيانات Milvus.retrieval/query_expansion.py : تنفذ تقنيات توسيع الاستعلام.retrieval/hybrid_retrieval.py : يحتوي على منطق الاسترجاع المختلط.qa/llm_qa.py : يدير عملية الإجابة على الأسئلة باستخدام نموذج لغة. SentenceTransformer في main.pycrawl_data (تم تعيينها حاليًا على 5 مستويات).top_k في استدعاء طريقة retrieve . إذا واجهت أي مشاكل:
لأي مشاكل مستمرة ، يرجى فتح مشكلة في مستودع GitHub.