โครงการนี้แสดงให้เห็นถึงวิธีการใช้งานท่อ ส่ง (RAG) การ ดึง (RAG) โดยใช้ การฝังใบหน้า และ Chromadb สำหรับการค้นหาความหมายที่มีประสิทธิภาพ โซลูชันอ่านกระบวนการและฝังข้อมูลข้อความทำให้ผู้ใช้สามารถทำการสืบค้นข้อมูลที่ถูกต้องและรวดเร็วบนข้อมูล
BAAI/bge-base-en-v1.5 ) เพื่อแปลงชิ้นข้อความเป็นตัวแทนเวกเตอร์ก่อนที่จะเรียกใช้สมุดบันทึกตรวจสอบให้แน่ใจว่ามีการติดตั้งไลบรารีที่จำเป็น:
pip install chromadb
pip install llama-indexคุณต้องโคลนชุดข้อมูลที่จำเป็นจากการกอดหน้าถ้าคุณต้องการตรวจสอบและทดสอบการทำงาน :)::
git clone https://huggingface.co/datasets/NahedAbdelgaber/evaluating-student-writing
git clone https://huggingface.co/datasets/transformersbook/emotion-train-splitโหลดชุดข้อมูล :
การสร้างการสร้าง :
BAAI/bge-base-en-v1.5 ชิ้นข้อความจะถูกแปลงเป็น Embeddings เวกเตอร์ คุณสามารถสร้างความชอบได้การรวม Chromadb :
การค้นหาความหมาย :
ในการใช้รหัสเพียงเรียกใช้โน้ตบุ๊กหลังจากติดตั้งการพึ่งพาและโคลนชุดข้อมูลที่ต้องการ คำสั่งต่อไปนี้สามารถใช้ในการสืบค้น embeddings ที่เก็บไว้:
query_collection ( "Your search query here" , n_results = 1 )สิ่งนี้จะส่งคืนข้อความที่เกี่ยวข้องมากที่สุดตามแบบสอบถามที่ให้ไว้
query_collection (
"Even though the planet is very similar to Earth, there are challenges to get accurate data because of the harsh conditions on the planet." ,
n_results = 1
)มี 2 ไฟล์ที่นี่ อันง่าย ๆ เพียงแค่สร้างฐานข้อมูลเวกเตอร์ของไฟล์เดียวและไฟล์ล่วงหน้าสามารถทำงานกับหลาย ๆ ไฟล์ด้วยส่วนขยายที่แตกต่างกันและสร้างฐานข้อมูลเวกเตอร์ของไฟล์เหล่านั้นและคุณยังสามารถทดสอบได้ในโมเดล Text-Gen
ที่เก็บนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT