Автоматизированная библиотека Python обеспечивает удобный доступ к автоматизированному REST API из любого приложения Python 3.10+. Библиотека включает определения типов для всех параметров запроса и полей ответа и предлагает как синхронные, так и асинхронные клиенты на базе httpx.
Важный
Служба извлечения документов в настоящее время находится на стадии закрытого бета-тестирования.
# установка из PyPIpip автоматическая установка
Определите целевую модель, которую вы хотите заполнить, и передайте ее вместе с PDF-файлом, который вы хотите обработать, в метод .extract_model() . Ваши первые 1000 документов бесплатны, просто не забудьте заменить свой адрес электронной почты в API_KEY . После первого запуска извлечения вы получите письмо с подтверждением и ссылкой. Первый запуск завершится неудачно, поскольку ваш адрес электронной почты (определенный в вашем ключе API) еще не проверен. После проверки вы можете повторно запустить скрипт, и он должен работать. Вот пример:
из даты и времени импорта из поля импорта pydantic, BaseModel из автоматического импорта DocExtClient# из автоматического импорта AsyncDocExtClientclass Article(BaseModel): номер_статьи: str | Нет = Поле(Нет, описание="Обычно буквенно-цифровое.") описание: str | Нет = Поле(Нет, описание="Описание товара.") количество: float | Нет = Поле(Нет, описание="Количество штук") класс PurchaseOrder(BaseModel): имя_клиента: str | Нет = Поле(Нет, описание="Примеры: Kaladent Inc., Henkel GmbH") номер_заказа: str | Нет = Поле(Нет, описание="Номер заказа на закупку.") order_date: дата | Нет = Поле(Нет, описание="Дата заказа на закупку.") элементы: список[Статья] = Поле(default_factory=list, описание="Список всех заказанных товаров.")client = DocExtClient(API_KEY="TEST_BETA:you" @company.com") # Замените адрес электронной почты на свой. Как только мы завершим бета-тестирование, вы получите правильный ключ API для производства.result: PurchaseOrder = client.extract_model(PurchaseOrder, "./po.pdf") # automaited.dev/samplesprint(result)
Вы можете скачать образец PDF здесь: automaited.dev/samples. Если вы хотите узнать больше о том, как определять целевые модели, просто взгляните на документацию pydantic.