patentpy
Update to PyPI
| CI | 状態 |
|---|---|
| Docker Circleci | |
| コードカバレッジ |
Patentpyパッケージを使用すると、USPTO(米国特許商標局)のバルク特許データに長方形の形式で簡単にアクセスできます。特許データをUSPTO Webサイトから直接ダウンロード、変換、保存することにより、Patentpyは使用可能なデータを取得するために必要な作業を最小限に抑え、ユーザーがデータの分析に集中できるようにします。これのRバージョンは、https://github.com/jyprojs/patentrにあります。
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpy注:このパッケージは、Pybind11を使用して、XMLファイルを解析するためにC ++コード、LXML、およびPANDASを解析するためにPANDAをラップするために、USPTOバルクデータをデータフレームとして提示するオプションを使用します。
TXTまたはXML形式(1976+)のバルク特許データは、次のように年(毎年)を使用してダウンロードできます。
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
Patentpyに貢献するには、問題ページでバグ/提案の問題を作成できます。また、Patentpyリポジトリをフォークし、ユーザーに役立つと思われる機能を追加するためのプルリクエストを作成することもできます。
Yu J、Wadhwa RR、Beltz H、Desai MY、Scott JG、Erdi P. Patentpy:USPTOバルクデータは長方形の形式で。 2021; Pythonパッケージバージョン0.1.0。 url https://github.com/jyprojs/patentpy。