patentpy
Update to PyPI
| CI | 地位 |
|---|---|
| Docker Circleci | |
| 代码覆盖范围 |
该专利套件可轻松访问USPTO(美国专利和商标办公室)的构成专利数据。通过直接从USPTO网站下载,转换和存储专利数据,Patentpy最大程度地减少了获取可用数据所需的工作,从而使用户可以专注于分析数据。可以在https://github.com/jyprojs/patentr上找到其R版本。
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpy注意:此软件包利用PYBIND11包装用C ++代码编写的自定义TXT解析器,LXML将其解析为XML文件,并选择将USPTO批量数据显示为数据帧。
可以使用TXT或XML格式的批量专利数据(1976+)使用年度和一周(每年)下载如下:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
为了为PATENTPY做出贡献,您可以在“问题”页面上为任何错误/建议创建问题。您还可以分配Pathentpy存储库,并创建拉动请求,以添加您认为对用户有用的功能。
Yu J,Wadhwa RR,Beltz H,Desai MY,Scott JG,ÉrdiP。Pathentpy:以矩形格式访问USPTO批量数据。 2021; Python软件包版本0.1.0。 URL https://github.com/jyprojs/patentpy。