Anthropic a récemment annoncé que son modèle SONNET CLAUDE 3.5 avait ajouté des capacités de traitement de fichiers PDF et est maintenant entré en scène bêta publique. Cette fonction permet aux utilisateurs d'analyser le texte et les éléments visuels dans les documents PDF, y compris les images, les graphiques et les tables. Cette décision étend encore les fonctions de Claude, offrant aux utilisateurs des capacités de traitement des documents plus fortes et améliorant l'efficacité du travail.
Récemment, la société d'intelligence artificielle Anthropic a annoncé qu'elle avait ajouté des capacités de traitement de fichiers PDF à son modèle de Sonnet Claude 3.5, qui est maintenant entré dans la phase de test public. Les utilisateurs peuvent désormais utiliser le modèle pour analyser le texte et les éléments visuels dans des documents PDF, y compris les images, les graphiques et les tables, pour une variété de scénarios tels que les rapports financiers, les documents juridiques et la traduction de documents.
Le processus de traitement PDF de Claude 3.5 Sonnet est divisé en trois étapes. Tout d'abord, le système extrait le contenu texte du document. Ensuite, chaque page du document est convertie en une image pour une analyse plus approfondie. Cela permet aux utilisateurs non seulement d'obtenir des informations de texte, mais aussi de mieux comprendre les informations visuelles dans les fichiers PDF.
Il convient de mentionner que la fonction PDF de Claude peut également être utilisée en conjonction avec d'autres fonctionnalités, telles que l'extraction d'informations spécifiques et l'utiliser comme entrée d'outil. Il convient de noter que les fichiers téléchargés doivent être inférieurs à 32 Mo et que le nombre de pages ne doit pas dépasser 100 pages. Le système ne prend actuellement pas en charge les documents cryptés ou protégés par mot de passe.
Le coût du traitement des fichiers PDF varie en fonction de la durée du document et de la densité de contenu. En règle générale, 1 500 à 3 000 jetons par page sont consommés sans frais supplémentaires dépassant les frais de jeton standard. Les utilisateurs peuvent utiliser cette nouvelle fonctionnalité via l'aperçu de la fonctionnalité de chat Claude et l'accès à l'API, ce qui nécessite l'utilisation d'un en-tête de demande spécifique "Anthropic-beta: PDFS-2024-09-25" dans les demandes d'API. Anthropic prévoit d'étendre cette fonctionnalité sur les plates-formes Amazon Boudrock et Google Vertex AI à l'avenir.
Pour améliorer le traitement, Anthropic recommande aux utilisateurs que le document ait un texte clair et lisible et que la disposition de la page est correcte. De plus, lors de la cite du contenu spécifique, les utilisateurs doivent utiliser le numéro de page affiché dans le lecteur PDF. Et lors de l'utilisation de l'API, les fichiers PDF doivent être placés avant le texte. Si le document est plus grand et dépasse la limite, Anthropic recommande de le diviser en sections plus petites. Enfin, lors de l'analyse du même document plusieurs fois, les utilisateurs peuvent également envisager d'utiliser un cache rapide pour améliorer l'efficacité du traitement.
Points clés:
Anthropic lance Claude 3.5 Sonnet, ajoutant des capacités de traitement de fichiers PDF pour prendre en charge l'analyse du texte et de l'image.
Le processus de traitement est divisé en trois étapes: extraire du texte, conversion des pages en images et analyse complète.
Les coûts de traitement varient en fonction de la longueur du document et de la densité de contenu, et les utilisateurs sont soumis à la taille du fichier et aux limites de page.
La fonction de traitement PDF de Claude 3.5 Sonnet fournit aux utilisateurs des solutions d'analyse de documents efficaces et pratiques.