Недавно Anpropic объявил, что ее модель Sonnet Claude 3.5 добавила возможности обработки файлов PDF и в настоящее время вступила в публичную бета -стадию. Эта функция позволяет пользователям анализировать текстовые и визуальные элементы в PDF -документах, включая изображения, диаграммы и таблицы. Это еще больше расширяет функции Клода, предоставляя пользователям более сильные возможности обработки документов и повышая эффективность работы.
Недавно компания Artifical Intelligence Company Anpropic объявила, что она добавила возможности обработки файлов PDF в свою модель Sonnet Claude 3.5, которая в настоящее время вступила в фазу публичных испытаний. Теперь пользователи могут использовать модель для анализа текста и визуальных элементов в PDF -документах, включая изображения, диаграммы и таблицы, для различных сценариев, таких как финансовые отчеты, юридические документы и перевод документов.
Процесс обработки PDF Claude 3.5 сонета разделен на три шага. Во -первых, система извлекает текстовый контент из документа. Затем каждая страница документа преобразуется в изображение для более глубокого анализа. Это позволяет пользователям не только получать текстовую информацию, но и получить представление о визуальной информации в файлах PDF.
Стоит отметить, что функция PDF Claude также может использоваться в сочетании с другими функциями, такими как извлечение конкретной информации и использование ее в качестве ввода инструмента. Следует отметить, что загруженные файлы должны быть менее 32 МБ, а количество страниц не должно превышать 100 страниц. Система в настоящее время не поддерживает зашифрованные или защищенные паролем документы.
Стоимость обработки файлов PDF варьируется в зависимости от длины документа и плотности контента. Как правило, от 1500 до 3000 токенов на страницу потребляются без дополнительных сборов, превышающих стандартную плату за токен. Пользователи могут использовать эту новую функцию через предварительный просмотр функции чата Claude и доступ к API, который требует использования конкретного заголовка запроса «Антропно-бета: PDFS-2024-09-25» в запросах API. Антропический планирует расширить эту функцию на платформы Amazon Bedrock и Google Vertex AI в будущем.
Чтобы улучшить обработку, Anpropic рекомендует пользователям гарантировать, что в документе есть четкий и читаемый текст, а макет страницы верен. Кроме того, при цитировании конкретного контента пользователи должны использовать номер страницы, отображаемый в читателе PDF. И во время использования API файлы PDF должны быть размещены до текста. Если документ больше и превышает предел, Anpropic рекомендует разделить его на более мелкие секции. Наконец, при анализе одного и того же документа несколько раз пользователи также могут рассмотреть возможность использования быстрого кэша для повышения эффективности обработки.
Ключевые моменты:
Anpropic запускает Sonnet Claude 3.5, добавляя возможности обработки файлов PDF для поддержки анализа текста и изображений.
Процесс обработки разделен на три этапа: извлечение текста, преобразование страниц в изображения и всесторонний анализ.
Затраты на обработку варьируются в зависимости от длины документа и плотности контента, а пользователи подвергаются размеру файла и ограничениям страниц.
Функция обработки PDF Claude 3.5 Sonnet предоставляет пользователям эффективные и удобные решения для анализа документов.