VBench
1.0.0
Vbenchは、SQLインターフェイスに基づいてベクター分析Querieを評価するためのベンチマークです。 vbenchは、スカラー属性で補強されたRecipe1mデータセットを使用し、Join、Groupby、Filter、Topkなどの標準的なSQLオペレーターを利用する包括的なベクター分析Querieを提供します。
このレポでは、指示を提供します
vbenchデータセットは、レシピテーブルとタグテーブルの2つのテーブルで構成されています。
| 列名 | データ型 | 例 | メモ |
|---|---|---|---|
| recipe_id | 識別子 | 1 | 主キー |
| 画像 | 文字列のリスト | ['データ/画像/1/0.jpg'、...] | 画像のパス |
| 説明 | 文章 | [成分] + [指導] | スパースベクトル |
| Images_embeding | ベクター | [-0.0421、0.0296、...、0.0273] | 密なベクトル、1024寸法 |
| 説明_embeding | ベクター | [0.0056、-0.0487、...、0.0034] | 密なvect、1024寸法 |
| 価格 | 整数 | 18 | 料理の価格 |
| 列名 | データ型 | 例 | メモ |
|---|---|---|---|
| id | 識別子 | 1 | 主キー |
| tag_name | 文章 | "サラダ" | タグの名前 |
| tag_vector | ベクター | [-0.0137、0.0421、...、0.0183] | 埋め込みまたは重量ベクトル、1024寸法 |
これらの2つのテーブルを生成する方法に関する詳細な保険についてはdataset_generation/README.mdを参照してください。
Vbenchには12クエリがあり、4つのカテゴリに分類できます。
quereis.sqlを参照してください。 さまざまなベクトル検索エンジンを評価する方法に関する詳細な妨害についてはevaluation/README.mdを参照してください。
コードベース全体がMITライセンスを取得しています。