RAG for Papers with Code هي طريقة أسهل للمسح من خلال أطنان من أبحاث ML بمجرد ضرب زر. نظام الخرقة الذي يلعب كمية كبيرة من المعلومات بسهولة. ستطرح عليها أسئلتك بلغة طبيعية وستجيب وفقًا للأوراق ذات الصلة التي تجدها على الأوراق مع الكود.
على جانب الواجهة الخلفية ، يتم تشغيل النظام بإطار عمل معزز للاسترجاع (RAG) يعتمد على قاعدة بيانات متجهة قابلة للتطوير بدون خادم تسمى Upstash ، للتضمينات ، نستخدم نماذج BGE على معانقة ، و Mixtral-8x7b-instruct-V0.1 كـ LLM من معانقة.
على الجانب الأمامي ، سيتم دمج هذا المساعد في تطبيق ويب تفاعلي يمكن نشره بسهولة مصمم باستخدام STIPLELIT.
استنساخ الريبو
git clone https://github.com/wittyicon29/PWC-RAG.gitانتقل إلى دليل مساحة العمل
cd PWC-RAG الفهرسة لفهرسة البيانات في المتجه DB ، تحتاج أولاً إلى إنشاء فهرس على Upstash وملء بيانات الاعتماد في ملف .env :
UPSTASH_URL=...
UPSTASH_TOKEN=...
قم بتشغيل الأمر التالي:
python -m src.index_papers --query " Mistral " --limit 200نتيجة لفهرسة 200 قطعة مطابقة لاستعلام "Mistral".


تشغيل التطبيقات البطيئة محليًا
قبل تشغيل تطبيق SPEREMLIT ، يجب عليك تعيين رمز API Luggingface في ملف ".env":
HUGGINGFACE_API_TOKEN=...الآن يمكنك تطبيق SPERANDLIT
python -m streamlit run src/app.py
كيفية بناء تطبيق يعمل بالطاقة LLM للدردشة مع PapersWithCode