VBench es un punto de referencia para evaluar las quitas analíticas vectoriales basadas en la interfaz SQL. VBench utiliza el conjunto de datos Recipe1M aumentado con atributos escalares, y proporciona un conjunto integral de directores analíticos vectoriales que utilizan operadores SQL estándar, incluidos Join, Groupby, Filter y TOPK.
En este repositorio, proporcionamos instrucciones sobre
El conjunto de datos VBench consta de dos tablas: tabla de recetas y tabla de etiquetas.
| Nombre de columna | Tipo de datos | Ejemplo | Notas |
|---|---|---|---|
| receta_id | Identificador | 1 | clave principal |
| imágenes | Lista de cadena | ['Data/Images/1/0.jpg', ...] | Caminos de imágenes |
| descripción | Texto | [ingredientes] + [instrucción] | vector escaso |
| Images_embedding | Vector | [-0.0421, 0.0296, ..., 0.0273] | Vector denso, 1024 dimensiones |
| descripción_mbedding | Vector | [0.0056, -0.0487, ..., 0.0034] | denso vecto, 1024 dimensiones |
| precio | Entero | 18 | Precio del plato |
| Nombre de columna | Tipo de datos | Ejemplo | Notas |
|---|---|---|---|
| identificación | Identificador | 1 | clave principal |
| tag_name | Texto | "ensalada" | Nombre de la etiqueta |
| tag_vector | Vector | [-0.0137, 0.0421, ..., 0.0183] | incrustación o vector de peso, 1024 dimensiones |
Consulte dataset_generation/README.md para obtener detallados sobre cómo generar estas dos tablas.
VBench tiene 12 consultas, que se pueden dividir en cuatro categorías:
quereis.sql para obtener detalles. Consulte evaluation/README.md para obtener detalles sobre cómo evaluar diferentes motores de búsqueda de vectores.
Toda la base de código está bajo la licencia MIT.