자동화된 Python 라이브러리는 모든 Python 3.10+ 애플리케이션에서 자동화된 REST API에 대한 편리한 액세스를 제공합니다. 라이브러리에는 모든 요청 매개변수 및 응답 필드에 대한 유형 정의가 포함되어 있으며 httpx로 구동되는 동기 및 비동기 클라이언트를 모두 제공합니다.
중요한
문서 추출 서비스는 현재 비공개 베타 버전입니다.
# PyPipip에서 설치 자동 설치
채우려는 대상 모델을 정의하고 이를 .extract_model() 메서드로 처리하려는 PDF와 함께 전달합니다. 처음 1000개의 문서는 무료입니다. API_KEY 에서 이메일을 바꾸세요. 처음으로 추출을 실행하면 링크가 포함된 확인 메일을 받게 됩니다. 귀하의 이메일(API 키에 정의됨)이 아직 확인되지 않았기 때문에 첫 번째 실행이 실패합니다. 확인 후 스크립트를 다시 실행하면 제대로 작동할 것입니다. 예는 다음과 같습니다.
from datetime import datefrom pydantic import Field, BaseModelfrom 자동 가져오기 DocExtClient# from 자동 가져오기 AsyncDocExtClientclass Article(BaseModel): Article_number: str | None = Field(없음, 설명="일반적으로 알파벳 또는 영숫자순입니다.") 설명: str | None = Field(없음, 설명="항목 설명.") 수량: float | None = Field(없음, 설명="조각 수.")class BuyOrder(BaseModel): customer_name: str | None = Field(없음, 설명="예: Kaladent Inc., Henkel GmbH") order_number: str | None = Field(없음, 설명="구매 주문 번호입니다.") order_date: 날짜 | None = Field(없음, 설명="구매 주문 날짜.") items: list[Article] = Field(default_factory=list, Description="주문한 모든 기사 목록.")client = DocExtClient(API_KEY="TEST_BETA:you @company.com") # 이메일을 귀하의 이메일로 바꿉니다. 베타가 종료되자마자 Production.result에 대한 적절한 API 키를 받게 됩니다: BuyOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automaited.dev/samplesprint(result)
여기에서 샘플 PDF를 다운로드할 수 있습니다: automaited.dev/samples 대상 모델을 정의하는 방법에 대해 자세히 알아보려면 pydantic 문서를 살펴보세요.