vector database food similarity
1.0.0
基于开放食品事实的具有色度矢量数据库的食品的相似性建议。

使用开放食品事实API检索了大约10,000种产品,但有些产品缺乏信息,因此经过处理后,我们有大约4,300种产品。每种产品都有唯一的标识符,名称,图像URL和成分的百分比。有超过1,500个索引向量,每个载体代表食品总食品中成分的百分比(例如糖,油,水等)。
要启动数据集的生成,请运行以下命令:
npm run data-mining迁移将将产品数据集( products.json )导出到本地Chroma数据库。
要启动迁移,请运行:
npm run migration要对矢量数据库进行查询,您需要从产品数据中生成向量。
首先,我们称之为开放式食物事实产品API。然后,我们生成用于嵌入的向量( likeliest_recipes.json ),并使用它们向数据库提出请求。
默认情况下,当在Chroma数据库上执行查询时,使用Squared L2 Norm Vector Norm确定相似的产品:

其他矢量规范也可用,例如Inner product或Cosine similarity ,有关Chroma和Hnswlib的更多详细信息。
npm cidocker run -p 8000:8000 chromadb/chroma:0.4.213017620429484 :https://world.openfoodfacts.org/product/3017620429484/nutella-nnetella-hazel-hazelnut-spread-ferrearo) node ./query.js product=3017620429484所有数据集都是使用开放式食物事实API提取的。捐赠给开放食品事实项目
该项目已获得GNU AGPL V3许可证的许可。
有关更多详细信息,请参见许可证。