สำรวจการใช้ DSPY สำหรับการแยกคุณสมบัติจาก PDF ที่เก็บนี้ให้ตัวอย่างง่ายๆของวิธีการใช้เฟรมเวิร์กนี้เพื่อทำนายหมวดหมู่ย่อยของกระดาษวิทยาศาสตร์คอมพิวเตอร์จาก arxiv
ชุดข้อมูล คือการเลือกเอกสาร arxiv 150 รายการ (ข้อมูลเมตา + PDF) จากหมวดวิทยาศาสตร์คอมพิวเตอร์
เพื่อสร้างฐานข้อมูล:
dspy-arxivarxiv.jsondata.ipynb จากบนลงล่างในตอนท้ายคุณควรมีสองไดเรกทอรี:
หากคุณต้องการเพิ่ม RAG ลงในท่อมันมีประโยชน์ที่จะมีข้อมูลในฐานข้อมูลเวกเตอร์สำหรับการดึงอย่างรวดเร็ว ตรวจสอบ Database.py สำหรับสคริปต์ตัวอย่างเพื่อตั้งค่า Chromadb และเติมด้วย arxiv metadata
คุณสมบัติ ของโน้ตบุ๊ก IPYNB สามารถมองเห็นได้อย่างง่าย ๆ เกี่ยวกับวิธีการใช้ DSPY เพื่อให้ LLM พร้อมโปรแกรมสำหรับการแยกฟีเจอร์ (ในกรณีนี้ทำนายหมวดหมู่ย่อยของกระดาษวิทยาศาสตร์คอมพิวเตอร์จาก Arxiv)
นอกจากนี้คุณยังสามารถดูสไลด์ที่สร้างขึ้นจากสมุดบันทึกนี้