| CI | Status |
|---|---|
| Docker Circleci | |
| Codeabdeckung |
Das Patentpy -Paket ermöglicht einen einfachen Zugang zu USPTO (United States Patent and Marken Office) Bulk Patentdaten im rechteckigen Format. Durch das Herunterladen, Konvertieren und Speichern von Patentdaten direkt von der USPTO -Website minimiert Patentpy die Arbeit, die für die Erwerfung nutzbarer Daten erforderlich ist, sodass Benutzer sich auf die Analyse der Daten konzentrieren können. Die R -Version davon finden Sie unter https://github.com/jyprojs/patentr.
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpyHINWEIS: In diesem Paket wird Pybind11 verwendet, um einen benutzerdefinierten TXT -Parser in C ++ - Code, LXML zu wickeln, um XML -Dateien zu analysieren, und Pandas, um USPTO -Bulk -Daten als Datenrahmen zu präsentieren.
Bulk -Patentdaten im TXT- oder XML -Format (1976+) können mit dem Jahr und der Woche (innerhalb eines Jahres) wie folgt heruntergeladen werden:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
Um zu Patentpy beizutragen, können Sie Probleme für Fehler/Vorschläge auf der Seite "Themen" erstellen. Sie können auch das Patentpy -Repository investieren und Pull -Anfragen erstellen, um Funktionen hinzuzufügen, von denen Sie glauben, dass sie für Benutzer nützlich sein werden.
Yu J., Wadhwa RR, Beltz H., Desai MY, Scott JG, Érdi P. Patentpy: Zugriff auf USPTO -Schüttgut Daten im rechteckigen Format. 2021; Python -Paketversion 0.1.0. URL https://github.com/jyprojs/patentpy.