| Ci | status |
|---|---|
| Docker Circleci | |
| Cakupan Kode |
Paket paten memungkinkan akses mudah ke USPTO (Paten Amerika Serikat dan Kantor Merek Dagang) Bulk Patent Data dalam format persegi panjang. Dengan mengunduh, mengonversi, dan menyimpan data paten langsung dari situs web USPTO, Patentpy meminimalkan pekerjaan yang diperlukan untuk memperoleh data yang dapat digunakan, memungkinkan pengguna untuk fokus menganalisis data. Versi R ini dapat ditemukan di https://github.com/jyprojs/patentr.
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpyCatatan: Paket ini menggunakan PyBind11 untuk membungkus parser txt khusus yang ditulis dalam kode C ++, LXML untuk parse file XML, dan panda untuk opsi menyajikan data curah USPTO sebagai DataFrame.
Data paten curah dalam format txt atau xml (1976+) dapat diunduh menggunakan tahun dan minggu (dalam setiap tahun) sebagai berikut:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
Untuk berkontribusi pada Patentpy, Anda dapat membuat masalah untuk setiap bug/saran di halaman masalah. Anda juga dapat membayar repositori paten dan membuat permintaan tarik untuk menambahkan fitur yang menurut Anda akan berguna bagi pengguna.
Yu J, Wadhwa RR, Beltz H, Desai MY, Scott JG, érdi P. Patentpy: akses data curah uspto dalam format persegi panjang. 2021; Paket Python Versi 0.1.0. Url https://github.com/jyprojs/patentpy.