chatbot مع PDF للبحث الدلالي على المستندات (بناء مع التدفق ، langchain ، pinecone/chroma/asure البحث المعرفي)
يحتوي هذا المستودع على مثال رمز لكيفية إنشاء chatbot تفاعلية للبحث الدلالي عبر المستندات. يتيح chatbot للمستخدمين طرح أسئلة اللغة الطبيعية والحصول على إجابات ذات صلة من مجموعة من المستندات. يستخدم chatbot STREMLIT لواجهة الويب و chatbot ، langchain ، ويستفيد من أنواع مختلفة من قواعد بيانات المتجهات ، مثل البحث عن المتجه pinecone و chroma و Azure Cromitive Search ، لإجراء بحث فعال ودقيق للتشابه. الكود مكتوب في Python ويمكن تعديله بسهولة لتناسب حالات الاستخدام المختلفة ومصادر البيانات.
يرجى أيضًا الاطلاع على قصتي في متوسطة (قواعد بيانات SPERICLIT و Vector: دليل لإنشاء تطبيقات ويب تفاعلية للبحث الدلالي عبر المستندات) لمزيد من المشاركة التفصيلية.
- preprocess_pinecone.ipynb <- مثال على استخدام نموذج التضمين من خدمة Azure Openai لتضمين المحتوى من المستند وحفظه في قاعدة بيانات ناقل Pinecone.
- preprocess_chroma.ipynb <- مثال على استخدام نموذج التضمين من خدمة Azure Openai لتضمين المحتوى من المستند وحفظه في قاعدة بيانات Vector Chroma.
- preprocess_acs.ipynb <- مثال على استخدام نموذج التضمين من خدمة Azure Openai لتضمين المحتوى من المستند وحفظه في قاعدة بيانات ناقل البحث المعرفي Azure.
- strupe_pinecone.ipynb <-مثال على استخدام وحدة إجابة أسئلة Langchain لإجراء البحث عن التشابه من قاعدة بيانات ناقل Pinecone واستخدام GPT-3.5 (Text-Davinci-003) لتلخيص النتيجة.
- strupe_chroma.ipynb <-مثال على استخدام وحدة إجابة أسئلة Langchain لإجراء البحث عن التشابه من قاعدة بيانات Vector Chroma واستخدام GPT-3.5 (Text-Davinci-003) لتلخيص النتيجة.
- استهلك _acs.ipynb <-مثال على استخدام وحدة إجابة أسئلة Langchain لإجراء بحث عن التشابه من قاعدة بيانات متجه البحث المعرفي Azure واستخدام GPT-3.5 (Text-Davinci-003) لتلخيص النتيجة.
- app_pinecone.py <- مثال على استخدام قاعدة بيانات ناقل SpreamLit و Langchain و Pinecone لإنشاء chatbot تفاعلية لتسهيل البحث الدلالي عبر المستندات. يستخدم نموذج GPT-3.5-Turbo من Azure Openai Service لتلخيص النتائج والدردشة.
- app_chroma.py <- مثال على استخدام قاعدة بيانات ناقل SpreamLit و Langchain و Chroma لإنشاء chatbot التفاعلية لتسهيل البحث الدلالي عبر المستندات. يستخدم نموذج GPT-3.5-Turbo من Azure Openai Service لتلخيص النتائج والدردشة.
- app_acs.py <- مثال على استخدام قاعدة بيانات متجه البحث المعرفي المعرفي ، و Azure ، و Azure لإنشاء chatbot التفاعلية لتسهيل البحث الدلالي عبر المستندات. يستخدم نموذج GPT-3.5-Turbo من Azure Openai Service لتلخيص النتائج والدردشة.
لتشغيل تطبيق الويب المبسط هذا
streamlit run app_pinecone.py
الهندسة المعمارية عالية المستوى وتدفق هذا البحث الدلالي على التوضيح الوثائق 
يتمتع!