VBench
1.0.0
VBENCH是評估基於SQL接口的矢量分析徵值的基準。 VBENCH使用配方1M數據集增加了標量屬性,並提供了一套全面的矢量分析征服,這些矢量分析 - 使用標準SQL運算符,包括Join,GroupBy,Filter和Topk。
在此存儲庫中,我們提供了有關的說明
VBench數據集由兩個表組成:食譜表和標籤表。
| 列名 | 數據類型 | 例子 | 筆記 |
|---|---|---|---|
| repipe_id | 標識符 | 1 | 主鍵 |
| 圖像 | 字符串列表 | ['數據/圖像/1/0.JPG',...] | 圖像路徑 |
| 描述 | 文字 | [成分] + [指令] | 稀疏矢量 |
| images_embedding | 向量 | [-0.0421,0.0296,...,0.0273] | 密集矢量,1024維 |
| Description_embedding | 向量 | [0.0056,-0.0487,...,0.0034] | 密集VECT,1024維度 |
| 價格 | 整數 | 18 | 盤子的價格 |
| 列名 | 數據類型 | 例子 | 筆記 |
|---|---|---|---|
| ID | 標識符 | 1 | 主鍵 |
| tag_name | 文字 | “沙拉” | 標籤的名稱 |
| tag_vector | 向量 | [-0.0137,0.0421,...,0.0183] | 嵌入或重量矢量,1024維度 |
有關如何生成這兩個表的詳細信息,請參閱dataset_generation/README.md 。
VBENCH有12查詢,可以分為四類:
quereis.sql有關詳細信息。 有關如何評估不同矢量搜索引擎的詳細信息,請參閱evaluation/README.md 。
整個代碼庫均在MIT許可下。