مرحبًا بكم في مشروع Generation (RAG) المعزز في الاسترجاع! ؟ يهدف هذا المشروع إلى تقديم وإظهار التطبيقات العملية لـ RAG باستخدام رمز Python في بيئة دفتر Jupyter. يستخدم Llamaindex هنا. نحن نعتقد أن تعلم وتجربة RAT يجب أن يكون تعليميًا وممتعًا! ؟
تم تنظيم المشروع في عدة مجلدات:
الملفات : يحتوي هذا المجلد على ملفات مهمة للرجوع إليها:
readme.md : أنت تقرأ هذا الملف حاليًا! يوفر نظرة عامة على المشروع.Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf : يشرح هذا الملف معلومات الخلفية ويوفر معلومات إضافية عن التجارب العملية باستخدام RAG. إنه أمر لا بد منه للبدء! Python_env : في هذا المجلد ، ستجد ملف NLP.yml . استيراد ملف YAML هذا لإنشاء بيئة بيثون مخصصة لتشغيل الكود بسلاسة.
الرمز : يحتوي مجلد code على ثلاثة ملفات دفتر جوبتر ، كل منها يمثل تجربة مختلفة:
1_Basic_RAG_Pipeline.ipynb : يوضح هذا الكمبيوتر الدفتري خط أنابيب الخرقة الأساسي. إنها نقطة انطلاق رائعة لفهم أساسيات الخرقة.2_Sentence_window_retrieval.ipynb : يستكشف هذا الكمبيوتر الدفتري مفهوم استرجاع نافذة الجملة باستخدام RAG. اكتشف كيف يمكن لـ RAT استرداد المعلومات من نافذة سياق محددة.3_Auto-merging_Retrieval.ipynb : في دفتر الملاحظات هذا ، ستتعرف على استرجاع التراجع التلقائي وكيفية تحسين عملية التوليد. أشياء مثيرة! البيانات : مجلد data هو المكان الذي يمكنك فيه تخزين المستندات الخاصة بك من الاهتمام بالاسترجاع. في الوقت الحالي ، قمنا بتضمين ملف مثال يدعى Henry.txt . لا تتردد في استبدالها بمستنداتك الخاصة لتجربة RAG.
شائع : داخل هذا المجلد ، ستجد ملف openAI.env . لا تنس إضافة مفتاح Openai API في هذا الملف لتمكين التفاعل السلس مع نماذج Openai.
لبدء رحلة الخرقة الخاصة بك ، اتبع هذه الخطوات:
استنساخ أو تنزيل مستودع المشروع هذا على جهازك المحلي.
استيراد ملف NLP.yml في مجلد python_env لإنشاء بيئة بيثون مخصصة. هذا يضمن تثبيت جميع التبعيات بشكل صحيح.
في المجلد common ، افتح ملف openAI.env وأدخل مفتاح Openai API الخاص بك. هذه الخطوة أمر بالغ الأهمية للوصول إلى نماذج Openai.
تعرف على المشروع من خلال قراءة Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf في مجلد files . يوفر معلومات أساسية مهمة وتجارب عملية.
استكشف ملفات دفتر NotboR الثلاثة ( 1_Basic_RAG_Pipeline.ipynb ، 2_Sentence_window_retrieval.ipynb ، و 3_Auto-merging_Retrieval.ipynb ) في مجلد code . قم بتشغيل دفاتر الملاحظات لرؤية خرقة في العمل!
قم بتجربة RAG عن طريق تعديل الأمثلة المقدمة أو استخدام المستندات الخاصة بك في مجلد data . لا تتردد في الإبداع والاستمتاع به! ؟
مبروك! أنت الآن مجهز بالمعلومات والأدوات اللازمة للتعلم والتطبيق والاستمتاع بالجيل المعزز للاسترجاع (RAG). نأمل أن يثير هذا المشروع فضولك ويشجعك على استكشاف عالم RAG المثير باستخدام دفاتر الملاحظات Jupyter المقدمة. سعيد توليد! ؟
إذا كان لديك أي أسئلة أو تحتاج إلى مزيد من المساعدة ، فالرجاء عدم التردد في التواصل. استمتع برحلة الخرقة الخاصة بك! ؟