| CI | statut |
|---|---|
| Docker Circleci | |
| Couverture de code |
Le package Patentpy permet un accès facile à USPTO (United States Patent and Trademark Office) Données de brevet en vrac au format rectangulaire. En téléchargeant, convertissant et stockant des données de brevet directement à partir du site Web de l'USPTO, Patentpy minimise le travail nécessaire pour acquérir des données utilisables, permettant aux utilisateurs de se concentrer sur l'analyse des données. La version R de celle-ci se trouve sur https://github.com/jyprojs/patent.
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpyRemarque: Ce package utilise PYBIND11 pour envelopper un analyseur TXT personnalisé écrit en code C ++, LXML pour analyser les fichiers XML et PANDAS pour la possibilité de présenter des données en vrac USPTO en tant que DataFrame.
Les données sur les brevets en vrac au format TXT ou XML (1976+) peuvent être téléchargées en utilisant l'année et la semaine (dans chaque année) comme suit:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
Pour contribuer à Patentpy, vous pouvez créer des problèmes pour tous les bogues / suggestions sur la page des problèmes. Vous pouvez également débarquer le référentiel Patentpy et créer des demandes de traction pour ajouter des fonctionnalités qui, selon vous, seront utiles pour les utilisateurs.
Yu J, Wadhwa RR, Beltz H, Desai MY, Scott JG, Érdi P. Patentpy: Accès aux données en vrac USPTO au format rectangulaire. 2021; Python Package Version 0.1.0. URL https://github.com/jyprojs/patentpy.