docuchat ai
وصف المشروع
هذا المشروع هو chatbot من الذكاء الاصطناعي المتخصص في استخراج وفهم المعلومات من مستندات PDF. يتيح للمستخدمين تحميل ملفات PDF متعددة ، ودراجات على محتوى تلك المستندات ، وتمكينهم من طرح الأسئلة أو إجراء استفسارات متعلقة بمحتوى PDFS. يقوم Chatbot بتعزيز Langchain و PypDF2 و STREMELIT لتوفير تجربة تفاعلية وسهلة الاستخدام.
ملخص
- تحميل ملفات PDF: يمكن للمستخدمين تحميل ملف PDF واحد أو أكثر إلى chatbot.
- التدريب: يقوم chatbot بمعالجة PDFs باستخدام langchain و pypdf2 لاستخراج البيانات النصية وإنشاء قاعدة للمعرفة.
- واجهة الدردشة: يمكن للمستخدمين بدء محادثات مع chatbot من خلال طرح الأسئلة أو إجراء استفسارات في نطاق مستندات PDF.
- الردود: يستخدم chatbot منظمة العفو الدولية لتوفير استجابات ذات مغزى بناءً على قاعدة المعرفة المدربة.
- سهولة في الاستخدام: تم تصميم المشروع مع واجهة سهلة الاستخدام باستخدام STIPLELIT لسهولة التفاعل.
استخدام الحالات
يحتوي chatbot AI التوليدي لـ PDFS على مجموعة واسعة من التطبيقات العملية ، بما في ذلك:
- مساعدة البحث : يمكن للباحثين استخراج المعلومات بسرعة من الأوراق والمجلات الأكاديمية ، مما يسهل العثور على الدراسات والبيانات ذات الصلة.
- تحليل المستندات القانونية : يمكن للمهنيين القانونيين استخدام chatbot لمراجعة المستندات القانونية والعقود والحوافز للإجابة على أسئلة محددة.
- دعم التعليم : يمكن للطلاب والمعلمين استخدام chatbot لفهم الموضوعات المعقدة بشكل أفضل من خلال طرح أسئلة حول الكتب المدرسية والأوراق البحثية.
- إنشاء قاعدة المعرفة : يمكن استخدام chatbot لإنشاء قاعدة معرفة من مجموعة من PDFs ، مما يسهل استرجاع البيانات.
- الوثائق الفنية : يمكن للمطورين والمهندسين استخدام chatbot للبحث عن معلومات محددة في أدلة فنية ووثائق.
- الامتثال والاستعلامات التنظيمية : يمكن لضباط الامتثال الاعتماد على chatbot لضمان الالتزام باللوائح من خلال الاستعلام عن وثائق الامتثال.
مكدس التكنولوجيا
- Langchain : يستخدم Langchain لمهام معالجة اللغة الطبيعية (NLP) ، بما في ذلك استخراج النص وفهمه.
- PYPDF2 : يتم استخدام PYPDF2 لاستخراج المحتوى النصي من مستندات PDF.
- STREMLIT : SPEREMLIT هو الإطار المستخدم لإنشاء واجهة ويب سهلة الاستخدام لـ chatbot.
- AI التوليدي : يشتمل المشروع على تقنيات الذكاء الاصطناعى التوليدي لإنشاء استجابات بناءً على محتوى PDFs.
- بيثون : تم تطوير المشروع بشكل أساسي في بيثون.
رابط تم نشره
عرض حي
ابدء
لتشغيل هذا المشروع محليًا ، اتبع هذه الخطوات:
- استنساخ المستودع:
git clone https://github.com/ShashankGupta10/DocuChat-AI.git
cd DocuChat-AI
pip install -r requirements.txt
streamlit run app.py