โครงการนี้ใช้ระบบตอบคำถาม (QA) สำหรับเอกสาร CUDA มันรวบรวมข้อมูลเอกสาร Nvidia CUDA ประมวลผลข้อมูลเก็บไว้ในฐานข้อมูลเวกเตอร์และใช้เทคนิคการดึงข้อมูลขั้นสูงเพื่อตอบคำถามของผู้ใช้
การพึ่งพาหลักสำหรับโครงการนี้คือ:
สำหรับรายการการพึ่งพาที่สมบูรณ์โปรดดูไฟล์ requirements.txt . txt
ตรวจสอบให้แน่ใจว่าคุณมีเซิร์ฟเวอร์ Milvus ทำงาน อ้างถึงเอกสาร Milvus สำหรับคำแนะนำในการติดตั้งและการตั้งค่า
เรียกใช้สคริปต์หลัก: 3. ระบบจะเริ่มต้นด้วยการรวบรวมข้อมูลเอกสาร CUDA ประมวลผลข้อมูลและจัดเก็บไว้ในฐานข้อมูล Milvus การตั้งค่าเริ่มต้นนี้อาจใช้เวลาพอสมควร
เมื่อการตั้งค่าเสร็จสมบูรณ์คุณสามารถเริ่มถามคำถามเกี่ยวกับ CUDA ระบบจะให้คำตอบตามข้อมูลที่ดึงมา
หากต้องการออกจากระบบให้พิมพ์ 'ออก' เมื่อได้รับแจ้งสำหรับคำถาม
main.py : สคริปต์หลักที่จัดทำกระบวนการทั้งหมดcrawler/web_crawler.py : มีตรรกะการรวบรวมข้อมูลเว็บdata_processing/chunking.py : ใช้เทคนิคการใช้ข้อมูลขั้นสูงdata_processing/embedding.py : จัดการการสร้างเวกเตอร์ฝังตัวvector_db/milvus_db.py : จัดการการโต้ตอบกับฐานข้อมูล Milvusretrieval/query_expansion.py : ใช้เทคนิคการขยายแบบสอบถามretrieval/hybrid_retrieval.py : มีตรรกะการดึงไฮบริดqa/llm_qa.py : จัดการกระบวนการตอบคำถามโดยใช้แบบจำลองภาษา SentenceTransformer ใน main.pycrawl_data (ปัจจุบันตั้งค่าเป็น 5 ระดับ)top_k ในการเรียกใช้วิธี retrieve หากคุณพบปัญหาใด ๆ :
สำหรับปัญหาใด ๆ โปรดเปิดปัญหาในที่เก็บ GitHub