ลิงค์บทความ
โครงการ Python นี้แสดงให้เห็นถึงการค้นหาความหมายโดยใช้ MongoDB และสองกรอบ LLM ที่แตกต่างกัน: Langchain และ Llamaindex เป้าหมายคือการโหลดเอกสารจาก MongoDB สร้าง EMBEDDINGS สำหรับข้อมูลข้อความและดำเนินการค้นหาความหมายโดยใช้เฟรมเวิร์ก Langchain และ Llamaidex
ในการเรียกใช้โครงการนี้คุณต้องตั้งค่าตัวแปรสภาพแวดล้อมต่อไปนี้ในไฟล์ .env :
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEXตรวจสอบให้แน่ใจว่าได้แทนที่ค่าตัวยึดตำแหน่งด้วยคีย์ API จริงและรายละเอียดการเชื่อมต่อ
ติดตั้งการพึ่งพา:
pip install -r requirements.txt
โครงการโหลดเอกสารจากคอลเลกชัน MongoDB ที่ระบุ ( MONGODB_COLL ) ตรวจสอบให้แน่ใจว่าคอลเลกชัน MongoDB ของคุณมีข้อมูลข้อความที่คุณต้องการทำการค้นหาความหมาย
แอปพลิเคชันสร้าง Embeddings สำหรับข้อมูลข้อความที่โหลดโดยใช้กรอบ Langchain และ Llamaidex Embeddings จะถูกเก็บไว้ในคอลเลกชัน MongoDB แยกต่างหาก ( MONGODB_VECTOR_COLL_LANGCHAIN และ MONGODB_VECTOR_COLL_LLAMAINDEX )
การค้นหาความหมายดำเนินการโดยใช้ทั้งกรอบ Langchain และ Llamaindex กระบวนการนี้เกี่ยวข้องกับการสืบค้นการรวบรวม Embeddings และดึงเอกสารที่เกี่ยวข้องขึ้นอยู่กับความคล้ายคลึงกันทางความหมายของพรอมต์
OPENAI_API_KEY เป็นสิ่งจำเป็นสำหรับการสร้างแบบฝังโดยใช้โมเดลภาษาภายนอก (เช่น GPT ของ OpenAI) ตรวจสอบให้แน่ใจว่าได้กำหนดค่ารายละเอียดการเชื่อมต่อ MongoDB และคอลเลกชันอย่างเหมาะสม ตรวจสอบเอกสารอย่างเป็นทางการสำหรับ Langchain และ Llamaidex สำหรับการกำหนดค่าเพิ่มเติมหรือรายละเอียดการใช้งานใด ๆ