| CI | สถานะ |
|---|---|
| Docker Circleci | |
| ความครอบคลุมของรหัส |
แพ็คเกจ PatentPy ช่วยให้สามารถเข้าถึง USPTO (สำนักงานสิทธิบัตรและเครื่องหมายการค้าของสหรัฐอเมริกา) ได้ง่ายข้อมูลสิทธิบัตรในรูปแบบสี่เหลี่ยม โดยการดาวน์โหลดการแปลงและการจัดเก็บข้อมูลสิทธิบัตรโดยตรงจากเว็บไซต์ USPTO ทำให้ PatentPy ลดงานที่จำเป็นในการรับข้อมูลที่ใช้งานได้ช่วยให้ผู้ใช้สามารถมุ่งเน้นการวิเคราะห์ข้อมูล รุ่น R ของสิ่งนี้สามารถดูได้ที่ https://github.com/jyprojs/patentr
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpyหมายเหตุ: แพ็คเกจนี้ใช้ PYBIND11 เพื่อห่อเพ้นท์ TXT แบบกำหนดเองที่เขียนในรหัส C ++, LXML เพื่อแยกวิเคราะห์ไฟล์ XML และแพนด้าสำหรับตัวเลือกในการนำเสนอข้อมูล USPTO Bulk เป็น dataframe
ข้อมูลสิทธิบัตรจำนวนมากในรูปแบบ TXT หรือ XML (1976+) สามารถดาวน์โหลดได้โดยใช้ปีและสัปดาห์ (ภายในแต่ละปี) ดังนี้:
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
ในการมีส่วนร่วมใน PatentPy คุณสามารถสร้างปัญหาสำหรับข้อบกพร่อง/คำแนะนำใด ๆ ในหน้าปัญหา นอกจากนี้คุณยังสามารถแยกที่เก็บข้อมูลสิทธิบัตรและสร้างคำขอดึงเพื่อเพิ่มคุณสมบัติที่คุณคิดว่าจะเป็นประโยชน์สำหรับผู้ใช้
Yu J, Wadhwa RR, Beltz H, Desai MY, Scott JG, Érdi P. Patentpy: เข้าถึง USPTO ข้อมูลจำนวนมากในรูปแบบสี่เหลี่ยม 2021; แพ็คเกจ Python เวอร์ชัน 0.1.0 url https://github.com/jyprojs/patentpy