VBench est une référence pour évaluer les quais analytiques vectorielles basées sur l'interface SQL. VBench utilise un ensemble de données Recipe1M augmenté d'attributs scalaires et fournit un ensemble complet de quais analytiques vectoriels qui utilisent des opérateurs SQL standard, y compris JOIN, GROUPBY, FILTER et TOPK.
Dans ce dépôt, nous fournissons des instructions sur
L'ensemble de données VBench se compose de deux tables: table de recettes et table de balise.
| Nom de colonne | Type de données | Exemple | Notes |
|---|---|---|---|
| recette_id | Identifiant | 1 | clé primaire |
| images | Liste de la chaîne | ['data / images / 1 / 0.jpg', ...] | Chemins d'images |
| description | Texte | [ingrédients] + [instruction] | vecteur clairsemé |
| images_embedding | Vecteur | [-0,0421, 0,0296, ..., 0,0273] | vecteur dense, 1024 dimensions |
| Description_embedding | Vecteur | [0,0056, -0.0487, ..., 0,0034] | Vect dense, 1024 dimensions |
| prix | Entier | 18 | prix du plat |
| Nom de colonne | Type de données | Exemple | Notes |
|---|---|---|---|
| identifiant | Identifiant | 1 | clé primaire |
| TAG_NAME | Texte | "salade" | Nom de la balise |
| tag_vecteur | Vecteur | [-0,0137, 0,0421, ..., 0,0183] | Vector d'incorporation ou de poids, 1024 dimensions |
Veuillez vous référer à dataset_generation/README.md pour les insuctions détaillées sur la façon de générer ces deux tables.
Vbench a 12 requêtes, qui peuvent être divisées en quatre catégories:
quereis.sql pour plus de détails. Veuillez vous référer à evaluation/README.md pour des insuctions détaillées sur la façon d'évaluer différents moteurs de recherche de vecteurs.
L'ensemble de la base de code est sous licence MIT.