VBench
1.0.0
VBench เป็นเกณฑ์มาตรฐานสำหรับการประเมินการวิเคราะห์การวิเคราะห์เวกเตอร์ตามอินเตอร์เฟส SQL VBENCH ใช้ชุดข้อมูล Recipe1M Augmented ด้วยแอตทริบิวต์สเกลาร์และจัดเตรียมชุดการวิเคราะห์การวิเคราะห์เวกเตอร์ที่ครอบคลุมซึ่งใช้ผู้ให้บริการ SQL มาตรฐานรวมถึงการเข้าร่วม, Groupby, Filter และ TOPK
ใน repo นี้เราให้คำแนะนำเกี่ยวกับ
ชุดข้อมูล VBench ประกอบด้วยสองตาราง: ตารางสูตรและตารางแท็ก
| ชื่อคอลัมน์ | ชนิดข้อมูล | ตัวอย่าง | หมายเหตุ |
|---|---|---|---|
| สูตร _id | ตัวระบุ | 1 | คีย์หลัก |
| ภาพ | รายการสตริง | ['data/images/1/0.jpg', ... ] | เส้นทางของภาพ |
| คำอธิบาย | ข้อความ | [ส่วนผสม] + [คำสั่ง] | เวกเตอร์กระจัดกระจาย |
| images_embedding | เวกเตอร์ | [-0.0421, 0.0296, ... , 0.0273] | เวกเตอร์หนาแน่น 1024 มิติ |
| คำอธิบาย _embedding | เวกเตอร์ | [0.0056, -0.0487, ... , 0.0034] | Vect หนาแน่น 1024 มิติ |
| ราคา | จำนวนเต็ม | 18 | ราคาของจาน |
| ชื่อคอลัมน์ | ชนิดข้อมูล | ตัวอย่าง | หมายเหตุ |
|---|---|---|---|
| รหัสประจำตัว | ตัวระบุ | 1 | คีย์หลัก |
| tag_name | ข้อความ | "สลัด" | ชื่อของแท็ก |
| tag_vector | เวกเตอร์ | [-0.0137, 0.0421, ... , 0.0183] | การฝังหรือเวกเตอร์น้ำหนัก 1024 มิติ |
โปรดดูที่ dataset_generation/README.md สำหรับรายละเอียดเกี่ยวกับวิธีการสร้างสองตารางนี้
Vbench มีข้อสงสัย 12 แบบซึ่งสามารถแบ่งออกเป็นสี่ประเภท:
quereis.sql สำหรับรายละเอียด โปรดดู evaluation/README.md สำหรับรายละเอียดเกี่ยวกับวิธีการประเมินเครื่องมือค้นหาเวกเตอร์ที่แตกต่างกัน
Codebase ทั้งหมดอยู่ภายใต้ใบอนุญาต MIT