patentpy
Update to PyPI
| CI | 地位 |
|---|---|
| Docker Circleci | |
| 代碼覆蓋範圍 |
該專利套件可輕鬆訪問USPTO(美國專利和商標辦公室)的構成專利數據。通過直接從USPTO網站下載,轉換和存儲專利數據,Patentpy最大程度地減少了獲取可用數據所需的工作,從而使用戶可以專注於分析數據。可以在https://github.com/jyprojs/patentr上找到其R版本。
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpy注意:此軟件包利用PYBIND11包裝用C ++代碼編寫的自定義TXT解析器,LXML將其解析為XML文件,並選擇將USPTO批量數據顯示為數據幀。
可以使用TXT或XML格式的批量專利數據(1976+)使用年度和一周(每年)下載如下:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
為了為PATENTPY做出貢獻,您可以在“問題”頁面上為任何錯誤/建議創建問題。您還可以分配Pathentpy存儲庫,並創建拉動請求,以添加您認為對用戶有用的功能。
Yu J,Wadhwa RR,Beltz H,Desai MY,Scott JG,ÉrdiP。 Pathentpy:以矩形格式訪問USPTO批量數據。 2021; Python軟件包版本0.1.0。 URL https://github.com/jyprojs/patentpy。