| ชื่อ | อีโมจิ | สีจาก | น้ำโคลอร์โต | SDK | sdk_version | app_file | ที่ถูกตรึง | ใบอนุญาต |
|---|---|---|---|---|---|---|---|---|
แชทกับเอกสารของคุณ | สีฟ้า | สีเทา | Gradeio | 4.41.0 | app.py | เท็จ | มิกซ์ |
แอพแชท ChatwithYourDocs เป็นแอปพลิเคชั่น Python ที่ให้คุณแชทกับรูปแบบเอกสารหลายรูปแบบเช่น PDF, หน้าเว็บและวิดีโอ YouTube คุณสามารถถามคำถามเกี่ยวกับ PDF โดยใช้ภาษาธรรมชาติและแอปพลิเคชันจะให้คำตอบที่เกี่ยวข้องตามเนื้อหาของเอกสาร แอพนี้ใช้รูปแบบภาษาเพื่อสร้างคำตอบที่แม่นยำสำหรับการสืบค้นของคุณ โปรดทราบว่าแอปจะตอบคำถามที่เกี่ยวข้องกับเอกสารที่โหลดเท่านั้น

แอปพลิเคชันทำตามขั้นตอนเหล่านี้เพื่อให้คำตอบสำหรับคำถามของคุณ:
การโหลด DOC: แอปอ่านเอกสารหลายประเภทและแยกเนื้อหาข้อความของพวกเขา
การถ่ายภาพข้อความ: ข้อความที่สกัดจะถูกแบ่งออกเป็นชิ้นเล็ก ๆ ที่สามารถประมวลผลได้อย่างมีประสิทธิภาพ
รูปแบบภาษา: แอปพลิเคชันใช้แบบจำลองภาษาเพื่อสร้างการเป็นตัวแทนของเวกเตอร์ (ฝัง) ของชิ้นข้อความ
การจับคู่ความคล้ายคลึงกัน: เมื่อคุณถามคำถามแอพจะเปรียบเทียบกับชิ้นข้อความและระบุคำถามที่คล้ายคลึงกันมากที่สุด
การสร้างการตอบสนอง: ชิ้นที่เลือกจะถูกส่งผ่านไปยังรูปแบบภาษาซึ่งสร้างการตอบสนองตามเนื้อหาที่เกี่ยวข้องของเอกสาร
หากต้องการติดตั้งแชทกับแอพเอกสารของคุณโปรดทำตามขั้นตอนเหล่านี้:
ดาวน์โหลด Ollama Library
curl https://ollama.ai/install.sh | sh
ดึงโมเดลแชทที่เราจะใช้ในกรณีนี้เราจะใช้ Llama2, Mistral และ Gemma
ollama pull llama2
ollama pull mistral
ollama pull gemma
สร้างสภาพแวดล้อมใหม่ด้วย Python 3.9 และเปิดใช้งานในกรณีนี้เราจะใช้ Conda
conda create -n cwd python=3.9
conda activate cwd
โคลนพื้นที่เก็บข้อมูลไปยังเครื่องในพื้นที่ของคุณ
git clone https://github.com/jorge-armando-navarro-flores/chat_with_your_docs.git
cd chat_with_your_docs
ติดตั้งการพึ่งพาที่ต้องการโดยเรียกใช้คำสั่งต่อไปนี้:
pip install -r requirements.txt
ติดตั้ง ffmpeg สำหรับวิดีโอ YouTube:
sudo apt-get install ffmpeg
หากต้องการใช้แชทกับแอพเอกสารของคุณให้ทำตามขั้นตอนเหล่านี้:
เรียกใช้ไฟล์ main.py โดยใช้ Streamlit CLI ดำเนินการคำสั่งต่อไปนี้:
python3 main.py
แอปพลิเคชันจะเปิดตัวในเว็บเบราว์เซอร์เริ่มต้นของคุณโดยแสดงส่วนต่อประสานผู้ใช้ 

ชั้นเรียน:
OllamaModel , OpenAIModel และ HFModel ที่จัดการผู้ให้บริการ LLM ที่เฉพาะเจาะจง (Ollama, Openai และ Hugging Face)ฟังก์ชั่น:
การตั้งค่า:
กำลังประมวลผล:
ปฏิสัมพันธ์:
predict ของ chatbot ผ่านการสืบค้นของผู้ใช้และประวัติการสนทนา (หากเปิดใช้งานการดึงข้อมูล)คุณสมบัติเพิ่มเติม:
โดยรวมแล้วรหัสนี้แสดงให้เห็นถึงสถาปัตยกรรมที่มีโครงสร้างที่ดีสำหรับ chatbot ที่สามารถใช้ประโยชน์จาก LLM ที่แตกต่างกันและรวมการดึงเอกสารเพื่อความสามารถที่เพิ่มขึ้น