VBench
1.0.0
VBench هو معيار لتقييم القوس التحليلي المتجه على أساس واجهة SQL. تستخدم VBENCH مجموعة بيانات الوصفة 1M المعززة بسمات قياسية ، وتوفر مجموعة شاملة من القذيفة التحليلية المتجهات التي تستخدم مشغلي SQL القياسيين ، بما في ذلك Join و Groupby و Filter و Topk.
في هذا الريبو ، نقدم تعليمات على
تتكون مجموعة بيانات VBENCH من جدولين: جدول الوصفة وجدول العلامة.
| اسم العمود | نوع البيانات | مثال | ملحوظات |
|---|---|---|---|
| وصفة | المعرف | 1 | المفتاح الأساسي |
| الصور | قائمة السلسلة | ["البيانات/الصور/1/0.JPG" ، ...] | مسارات الصور |
| وصف | نص | [المكونات] + [التعليمات] | متجه متناثر |
| Images_embedding | ناقل | [-0.0421 ، 0.0296 ، ... ، 0.0273] | ناقلات كثيفة ، 1024 أبعاد |
| Description_embedding | ناقل | [0.0056 ، -0.0487 ، ... ، 0.0034] | VECT كثيف ، 1024 أبعاد |
| سعر | عدد صحيح | 18 | سعر الطبق |
| اسم العمود | نوع البيانات | مثال | ملحوظات |
|---|---|---|---|
| بطاقة تعريف | المعرف | 1 | المفتاح الأساسي |
| TAG_NAME | نص | "سلطة" | اسم العلامة |
| TAG_VECTOR | ناقل | [-0.0137 ، 0.0421 ، ... ، 0.0183] | التضمين أو متجه الوزن ، 1024 أبعاد |
يرجى الرجوع إلى dataset_generation/README.md للحصول على تفاصيل الإطارات حول كيفية إنشاء هذين الجدولين.
لدى Vbench 12 استفسارًا ، يمكن تقسيمه إلى أربع فئات:
quereis.sql للحصول على التفاصيل. يرجى الرجوع إلى evaluation/README.md للحصول على تفاصيل الإطارات حول كيفية تقييم محركات البحث في ناقلات مختلفة.
قاعدة الكود بأكملها تحت رخصة معهد ماساتشوستس للتكنولوجيا.