docuchat ai
คำอธิบายโครงการ
โครงการนี้เป็น AI chatbot ที่มีความเชี่ยวชาญในการแยกและทำความเข้าใจข้อมูลจากเอกสาร PDF ช่วยให้ผู้ใช้สามารถอัปโหลดไฟล์ PDF หลายไฟล์รถไฟบนเนื้อหาของเอกสารเหล่านั้นและช่วยให้พวกเขาสามารถถามคำถามหรือทำการสอบถามที่เกี่ยวข้องกับเนื้อหาของ PDFS chatbot ใช้ประโยชน์จาก Langchain, Pypdf2 และ Streamlit เพื่อมอบประสบการณ์แบบโต้ตอบและใช้งานง่าย
ภาพรวม
- อัปโหลด PDFS: ผู้ใช้สามารถอัปโหลดไฟล์ PDF หนึ่งไฟล์ขึ้นไปไปยัง chatbot
- การฝึกอบรม: chatbot ประมวลผล PDFs โดยใช้ Langchain และ PyPDF2 เพื่อแยกข้อมูลข้อความและสร้างฐานความรู้
- อินเทอร์เฟซแชท: ผู้ใช้สามารถเริ่มต้นการสนทนากับ chatbot โดยถามคำถามหรือสอบถามข้อมูลภายในขอบเขตของเอกสาร PDF
- คำตอบ: chatbot ใช้ AI Generative เพื่อให้คำตอบที่มีความหมายตามฐานความรู้ที่ผ่านการฝึกอบรม
- ใช้งานง่าย: โครงการถูกสร้างขึ้นด้วยอินเทอร์เฟซที่ใช้งานง่ายโดยใช้ Streamlit เพื่อการโต้ตอบที่ง่าย
ใช้เคส
AI chatbot แบบกำเนิดสำหรับ PDFs มีแอพพลิเคชั่นที่หลากหลายรวมถึง::
- ความช่วยเหลือด้านการวิจัย : นักวิจัยสามารถดึงข้อมูลจากเอกสารทางวิชาการและวารสารได้อย่างรวดเร็วทำให้ง่ายต่อการค้นหาการศึกษาและข้อมูลที่เกี่ยวข้อง
- การวิเคราะห์เอกสารทางกฎหมาย : ผู้เชี่ยวชาญด้านกฎหมายสามารถใช้ chatbot เพื่อตรวจสอบเอกสารทางกฎหมายสัญญาและกฎหมายกรณีเพื่อตอบคำถามเฉพาะ
- การสนับสนุนการศึกษา : นักเรียนและนักการศึกษาสามารถใช้ chatbot เพื่อทำความเข้าใจหัวข้อที่ซับซ้อนได้ดีขึ้นโดยถามคำถามเกี่ยวกับตำราเรียนและงานวิจัย
- การสร้างฐานความรู้ : chatbot สามารถใช้เพื่อสร้างฐานความรู้จากคอลเลกชันของ PDFs อำนวยความสะดวกในการดึงข้อมูล
- เอกสารทางเทคนิค : นักพัฒนาและวิศวกรสามารถใช้ chatbot เพื่อค้นหาข้อมูลเฉพาะในคู่มือทางเทคนิคและเอกสารประกอบ
- คำสั่งการปฏิบัติตามกฎระเบียบและกฎระเบียบ : เจ้าหน้าที่การปฏิบัติตามกฎระเบียบสามารถพึ่งพา chatbot เพื่อให้แน่ใจว่าการปฏิบัติตามกฎระเบียบโดยการสอบถามเอกสารการปฏิบัติตามกฎระเบียบ
ซ้อนเทค
- Langchain : Langchain ใช้สำหรับงานการประมวลผลภาษาธรรมชาติ (NLP) รวมถึงการสกัดข้อความและความเข้าใจ
- PYPDF2 : PYPDF2 ถูกนำมาใช้เพื่อแยกเนื้อหาข้อความจากเอกสาร PDF
- Streamlit : Streamlit เป็นเฟรมเวิร์กที่ใช้สำหรับการสร้างเว็บอินเตอร์เฟสที่ใช้งานง่ายสำหรับ chatbot
- Generative AI : โครงการรวมเทคนิคการกำเนิด AI เพื่อสร้างการตอบสนองตามเนื้อหาของ PDF
- Python : โครงการได้รับการพัฒนาเป็นหลักใน Python
ลิงก์ที่ปรับใช้
การสาธิตสด
เริ่มต้น
ในการเรียกใช้โครงการนี้ในพื้นที่ให้ทำตามขั้นตอนเหล่านี้:
- โคลนที่เก็บ:
git clone https://github.com/ShashankGupta10/DocuChat-AI.git
cd DocuChat-AI
pip install -r requirements.txt
streamlit run app.py