vector database food similarity
1.0.0
基於開放食品事實的具有色度矢量數據庫的食品的相似性建議。

使用開放食品事實API檢索了大約10,000種產品,但有些產品缺乏信息,因此經過處理後,我們有大約4,300種產品。每種產品都有唯一的標識符,名稱,圖像URL和成分的百分比。有超過1,500個索引向量,每個載體代表食品總食品中成分的百分比(例如糖,油,水等)。
要啟動數據集的生成,請運行以下命令:
npm run data-mining遷移將將產品數據集( products.json )導出到本地Chroma數據庫。
要啟動遷移,請運行:
npm run migration要對矢量數據庫進行查詢,您需要從產品數據中生成向量。
首先,我們稱之為開放式食物事實產品API。然後,我們生成用於嵌入的向量( likeliest_recipes.json ),並使用它們向數據庫提出請求。
默認情況下,當在Chroma數據庫上執行查詢時,使用Squared L2 Norm Vector Norm確定相似的產品:

其他矢量規範也可用,例如Inner product或Cosine similarity ,有關Chroma和Hnswlib的更多詳細信息。
npm cidocker run -p 8000:8000 chromadb/chroma:0.4.213017620429484 :https://world.openfoodfacts.org/product/3017620429484/nutella-nnetella-hazel-hazelnut-spread-ferrearo) node ./query.js product=3017620429484所有數據集都是使用開放式食物事實API提取的。捐贈給開放食品事實項目
該項目已獲得GNU AGPL V3許可證的許可。
有關更多詳細信息,請參見許可證。