funko pop data
Initial database scrape
2021年1月3日 - 美国东部时间下午5:00
此存储库包含所有Funko Pop数据的JSON格式数据库。当从事与Funko Pops有关的小型项目时,注意到没有开源API可以获取Funko Pop数据。最好的资源是流行价指南,但数据仍然非常无法访问。
由于我无法找到所有Funko Pops的完整数据库,因此我决定在Internet上刮擦各种网站,以获取可用的Funko Pop列表。在此存储库中,您会找到一个包含23,000个Funko Pop产品条目的JSON文件。
所有数据都是开源的,可供任何人使用和在顶部使用。我将定期在这份名单上建立 - 可能每周。请随时将数据用于您的喜好。该项目具有MIT许可证。
请负责任地使用数据。对于Funko社区来说,这是一个有趣的项目。
当前,每个Funko Pop的数据都捕获了以下数据:
{
handle: ### A unique handle generated based on the title of the pop and using a `handleize` method.
image: ### A URL containing an image of what the Funko Pop looks like
title: ### The name of the Funko Pop
series: ### Array of series the Funko Pop is part of. I.E ["Pop! Animation","Pop! Vinyl","Emerald City Comic Con 2017"]
}
如果您想查看更多属性或如果它们有用,请提出问题,我将尝试添加数据。另外,可以随意打开PR。
除了JSON数据外,完全相同的数据还通过funko_pop.csv文件中的CSV公开。所有Funko Pop数据也已上传到公共Google Sheet。
我添加了我一直在使用的数据刮擦脚本。这不是完美的,但是可以做这项工作。根据您使用的设备,可以调整一些参数,例如sleep 。如果您想运行脚本,以下内容将帮助您入门:
npm install
node index.js
运行脚本后,将创建funko_pop.json文件。如果您希望将其导出到CSV格式,则可以运行:
node json-converter.js
如果您有改进,请打开PR,我会看看。积极寻找可能改善这种刮板的人。