patentpy
Update to PyPI
| CI | 상태 |
|---|---|
| Docker Circleci | |
| 코드 적용 범위 |
특허 패키지는 직사각형 형식의 USPTO (미국 특허 및 상표 사무소) 대량 특허 데이터에 쉽게 액세스 할 수 있습니다. USPTO 웹 사이트에서 특허 데이터를 직접 다운로드, 변환 및 저장함으로써 Patentpy는 유용한 데이터를 획득하는 데 필요한 작업을 최소화하여 사용자가 데이터 분석에 집중할 수 있도록합니다. 이 버전은 https://github.com/jyprojs/patentr에서 찾을 수 있습니다.
# install from PyPI
pip install patentpy
# To install development version
# clone repository then run follow code from its parent directory
pip install ./patentpy참고 :이 패키지는 pybind11을 사용하여 C ++ 코드로 작성된 사용자 정의 TXT 파서, LXML에 XML 파일을 구문 분석하고 팬더를 데이터 프레임으로 제시하는 옵션을 래핑합니다.
TXT 또는 XML 형식 (1976+)의 대량 특허 데이터는 다음과 같이 연도 및 주 (매년)를 사용하여 다운로드 할 수 있습니다.
# import get_bulk_patent_data functionality
from patentpy . acquire import get_bulk_patent_data
# download patents from the first week of 1976 and get data frame
patent_data = get_bulk_patent_data ( year = 1976 , week = 1 )
# download patents from the last 5 weeks of 1980
# and store in a CSV file named "patent-data.csv"
# Note: uspto patent data is reported on Tuesdays and 1980
# has 53 Tuesdays, hence, 53 weeks worth of data
get_bulk_patent_data ( year = [ 1980 ] * 5 , week = [ i for i in range ( 49 , 54 )], output_file = "patent-data.csv" )https://jyprojs.github.io/patentpy/index.html
특허에 기여하려면 문제 페이지에서 버그/제안에 대한 문제를 만들 수 있습니다. 또한 특허 저장소를 포크하고 사용자에게 유용 할 것이라고 생각되는 기능을 추가하기 위해 풀 요청을 만들 수도 있습니다.
Yu J, Wadhwa RR, Beltz H, Desai MY, Scott JG, Erdi P. 특허 : 직사각형 형식의 USPTO 벌크 데이터에 액세스합니다. 2021; 파이썬 패키지 버전 0.1.0. url https://github.com/jyprojs/patentpy.