Ce package fournit un cours pour extraire le texte d'un pdf.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdfSpatie est une agence de webdesign basée à Anvers, en Belgique. Vous trouverez un aperçu de tous nos projets open source sur notre site Internet.
Nous investissons beaucoup de ressources dans la création des meilleurs packages open source de leur catégorie. Vous pouvez nous soutenir en achetant l'un de nos produits payants.
Nous apprécions grandement que vous nous envoyiez une carte postale de votre ville natale, mentionnant le(s) forfait(s) que vous utilisez. Vous trouverez notre adresse sur notre page contact. Nous publions toutes les cartes postales reçues sur notre mur virtuel de cartes postales.
En coulisses, ce package exploite pdftotext. Vous pouvez vérifier si le binaire est installé sur votre système en exécutant cette commande :
which pdftotextS'il est installé, il renverra le chemin d'accès au binaire.
Pour installer le binaire, vous pouvez utiliser cette commande sur Ubuntu ou Debian :
apt-get install poppler-utilsSur un Mac, vous pouvez installer le binaire en utilisant Brew
brew install popplerSi vous utilisez RedHat, CentOS, Rocky Linux ou Fedora, utilisez ceci :
yum install poppler-utilsVous pouvez installer le package via composer :
composer require spatie/pdf-to-textExtraire du texte d’un pdf est facile.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();Ou plus simple :
echo Pdf:: getText ( ' book.pdf ' ); Par défaut, le package supposera que la commande pdftotext se trouve dans /usr/bin/pdftotext . S'il se trouve ailleurs, transmettez son chemin binaire au constructeur
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text (); ou comme deuxième paramètre de la méthode statique getText :
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' ); Parfois, vous souhaiterez peut-être utiliser les options pdftotext. Pour ce faire, vous pouvez les configurer à l'aide de la méthode setOptions .
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
; ou comme troisième paramètre de la méthode statique getText :
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]); Veuillez noter que les appels successifs à setOptions() écraseront les options transmises lors des appels précédents.
Si vous devez effectuer plusieurs appels pour ajouter des options (par exemple si vous devez transmettre les options par défaut lors de la création de l'objet Pdf à partir d'un conteneur, puis ajouter des options spécifiques au contexte ailleurs), vous pouvez utiliser la méthode addOptions() :
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;Veuillez consulter CHANGELOG pour plus d'informations sur ce qui a changé récemment.
composer test Veuillez consulter CONTRIBUER pour plus de détails.
Si vous avez trouvé un bug concernant la sécurité, veuillez envoyer un mail à [email protected] au lieu d'utiliser le suivi des problèmes.
Spatie est une agence de webdesign basée à Anvers, en Belgique. Vous trouverez un aperçu de tous nos projets open source sur notre site Internet.
La licence MIT (MIT). Veuillez consulter le fichier de licence pour plus d'informations.