يوفر هذا المستودع رمز نموذج لتنفيذ تطبيق الإجابة على أسئلة باستخدام تقنية Generation (RAG) المعززة للاسترجاع مع صخرة Amazon Bedrock. يتكون تطبيق الخرقة من جزأين:
خط أنابيب البيانات الذي يستوعب من المستندات (عادةً ما يتم تخزينه في Amazon S3) إلى قاعدة معرفة ، أي قاعدة بيانات متجه مثل Amazon OpenSearch Service Serverless (AOSS) بحيث تكون متاحة للبحث عند استلام سؤال.
التطبيق الذي يتلقى سؤالًا من المستخدم ، ويبحث عن قاعدة المعرفة للقطع ذات الصلة من المعلومات (السياق) ثم ينشئ مطالبة تتضمن السؤال والسياق ويوفرها إلى LLM لإنشاء استجابة.
يمثل خط أنابيب البيانات رفعًا ثقيلًا غير متمايز ويمكن تنفيذه باستخدام وكلاء الأساس الأمازون لقاعدة المعرفة. يمكننا الآن توصيل دلو S3 بقاعدة بيانات المتجهات مثل AOSS ولدينا عميل الأساس القراءة قراءة الكائنات (HTML ، PDF ، النص ، إلخ) ، وقطعها ، ثم تحويل هذه القطع إلى تضمينات باستخدام نموذج Amazon Titan Embeddings ثم تخزين هذه التضمينات في AOSS. كل هذا دون الحاجة إلى إنشاء ونشر وإدارة خط أنابيب البيانات.
بمجرد توفر البيانات في قاعدة معرفة الأساس ، يمكن بناء تطبيق الإجابة على سؤال باستخدام النمط المعماري التالي.

اتبع الخطوات المذكورة أدناه لإنشاء وتشغيل حل RAC. يصف المدونة _post.md هذا الحل بالتفصيل.
قم بتشغيل قالب AWS CloudFormation المدرج في هذا المستودع باستخدام أحد الأزرار من الجدول أدناه. ينشئ قالب CloudFormation الموارد التالية ضمن حساب AWS الخاص بك: مجموعة Amazon OpenSearch Serverless (AOSS) ، Amazon S3 Ducket ، أدوار IAM الخاصة بوكيل قاعدة المعرفة Amazon Bedrock ودفتر ملاحظات Amazon Sagemaker مع هذا المستودع المستنسخ لتشغيل الخطوات التالية.
| منطقة AWS | وصلة |
|---|---|
| US-East-1 (N. Virginia) | ![]() |
| الولايات المتحدة-غرب -2 (أوريغون) | ![]() |
اتبع الإرشادات في Build A Rag Teaking Answer Solution باستخدام قاعدة المعرفة Amazon Bedrock و Amazon OpenSearch Service Serverless
انظر المساهمة لمزيد من المعلومات.
هذه المكتبة مرخصة بموجب ترخيص MIT-0. انظر ملف الترخيص.