Doctalk?
Doctalk เป็นเว็บแอปพลิเคชันที่ใช้สตรีมที่ช่วยให้ผู้ใช้สามารถอัปโหลดและโต้ตอบกับเอกสารของพวกเขา (PDF, DOCX, TXT) โดยใช้แบบสอบถามภาษาธรรมชาติ แอปพลิเคชันใช้ประโยชน์จากโมเดล GPT-4O-MINI ของ OpenAI สำหรับการตรวจสอบความถูกต้องแบบสอบถามและการแชทและการทำข้อความ-3-3 เพื่อทำความเข้าใจและตอบสนองต่อการสอบถามผู้ใช้ตามเนื้อหาของเอกสารที่อัปโหลด
คุณสมบัติ
- การอัปโหลดและประมวลผลเอกสาร : อัปโหลดไฟล์ PDF, DOCX และ TXT สำหรับการแยกข้อความและการประมวลผล
- การนับ chunking & token ที่กำหนดเอง : การสร้างเอกสารที่กำหนดเองเพื่อปรับปรุงการดึงบริบทและการสร้างการตอบสนอง ใช้ Tokenizer ประโยคของ NLTK เพื่อประโยคที่เป็นเอกลักษณ์ของเอกสารตามด้วยการนับโทเค็นโดยใช้ tiktoken เพื่อจัดการขนาดก้อน
- แชทกับเอกสาร : ถามคำถามเกี่ยวกับเอกสารที่คุณอัปโหลดและรับคำตอบจากบริบท
- ความคล้ายคลึงกันของโคไซน์สำหรับการดึงบริบท : ใช้ความคล้ายคลึงกันของโคไซน์เพื่อค้นหาเอกสารที่เกี่ยวข้องมากที่สุดในการตอบสนองต่อการสืบค้นผู้ใช้
- การตรวจสอบความถูกต้องแบบสอบถาม : ใช้การเรียก API รองเพื่อตรวจสอบว่าหากการสืบค้นต้องการบริบทของเอกสารในที่สุดการประหยัดโทเค็นและลดต้นทุน
- การตรวจสอบรหัสผ่านของแอพง่าย ๆ : การเข้าถึงแอพได้รับการปกป้องด้วยรหัสผ่านเพื่อให้แน่ใจว่าผู้ใช้ที่ได้รับอนุญาตเท่านั้นสามารถโต้ตอบกับเอกสารได้
การติดตั้ง
โคลนที่เก็บ :
git clone https://github.com/kmaurinjones/doc-talk.git
cd doc-talk
สร้างสภาพแวดล้อมเสมือนจริง (เป็นทางเลือก แต่แนะนำ):
python3 -m venv env
source env/bin/activate
ติดตั้งแพ็คเกจที่ต้องการ :
pip install -r requirements.txt
ตัวแปรสภาพแวดล้อม
สร้างไฟล์ .env ในรูทของโครงการของคุณและเพิ่มตัวแปรสภาพแวดล้อมต่อไปนี้:
SIMPLE_AUTH_PASSCODE=your_passcode
OPENAI_API_KEY=your_openai_api_key
ทำงานในพื้นที่
ในการเรียกใช้แอปพลิเคชันในเครื่องให้ใช้คำสั่งต่อไปนี้:
สิ่งนี้จะเริ่มต้นเซิร์ฟเวอร์ Streamlit และคุณสามารถเข้าถึงแอพได้ที่ http://localhost:8501
การเข้าถึงแอพที่ปรับใช้
แอปพลิเคชันยังถูกปรับใช้และสามารถเข้าถึงได้ผ่าน URL ต่อไปนี้: การปรับใช้ Doctalk
การใช้งาน
- อัปโหลดเอกสาร : อัปโหลดไฟล์ PDF, DOCX หรือ TXT โดยใช้ไฟล์อัปโหลดไฟล์ในแอพ
- เอกสารประมวลผล : คลิกปุ่ม "เอกสารกระบวนการ" เพื่อแยกและประมวลผลข้อความจากไฟล์ที่อัปโหลด
- แชทกับเอกสาร : ใช้อินพุตแชทเพื่อถามคำถามเกี่ยวกับเนื้อหาของเอกสารที่อัปโหลด แอพจะให้คำตอบตามข้อความและบริบทที่ประมวลผลจากเอกสาร
ตัวอย่าง
นี่คือภาพหน้าจอบางส่วนของแอปพลิเคชัน Doctalk ที่ใช้:
การตรวจสอบผู้ใช้รหัสผ่านแบบง่าย ๆ

การอัปโหลดและประมวลผลเอกสาร

บริบทแบบสอบถามและการตอบสนอง

การบริจาค
ยินดีต้อนรับ! โปรดเปิดปัญหาหรือส่งคำขอดึงสำหรับการปรับปรุงหรือแก้ไขข้อผิดพลาดใด ๆ
ใบอนุญาต
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ดูไฟล์ LICENSE สำหรับรายละเอียด
ติดต่อ
สำหรับคำถามหรือปัญหาใด ๆ โปรดติดต่อฉันที่ [email protected]