Este paquete proporciona una clase para extraer texto de un pdf.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdfSpatie es una agencia de diseño web con sede en Amberes, Bélgica. Encontrará una descripción general de todos nuestros proyectos de código abierto en nuestro sitio web.
Invertimos muchos recursos en la creación de los mejores paquetes de código abierto. Puedes apoyarnos comprando uno de nuestros productos pagos.
Agradecemos mucho que nos envíe una postal desde su ciudad natal, mencionando cuál de nuestros paquetes está utilizando. Encontrarás nuestra dirección en nuestra página de contacto. Publicamos todas las postales recibidas en nuestro muro virtual de postales.
Detrás de escena, este paquete aprovecha pdftotext. Puede verificar si el binario está instalado en su sistema emitiendo este comando:
which pdftotextSi está instalado, devolverá la ruta al binario.
Para instalar el binario puedes usar este comando en Ubuntu o Debian:
apt-get install poppler-utilsEn una Mac puedes instalar el binario usando Brew.
brew install popplerSi estás en RedHat, CentOS, Rocky Linux o Fedora usa esto:
yum install poppler-utilsPuede instalar el paquete a través del compositor:
composer require spatie/pdf-to-textExtraer texto de un pdf es fácil.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();O más fácil:
echo Pdf:: getText ( ' book.pdf ' ); De forma predeterminada, el paquete asumirá que el comando pdftotext se encuentra en /usr/bin/pdftotext . Si está ubicado en otro lugar, pase su ruta binaria al constructor.
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text (); o como segundo parámetro del método estático getText :
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' ); A veces es posible que desee utilizar las opciones de pdf a texto. Para hacerlo, puede configurarlos utilizando el método setOptions .
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
; o como tercer parámetro del método estático getText :
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]); Tenga en cuenta que las llamadas sucesivas a setOptions() sobrescribirán las opciones pasadas durante llamadas anteriores.
Si necesita realizar varias llamadas para agregar opciones (por ejemplo, si necesita pasar opciones predeterminadas al crear el objeto Pdf desde un contenedor y luego agregar opciones específicas del contexto en otro lugar), puede usar el método addOptions() :
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;Consulte CHANGELOG para obtener más información sobre los cambios recientes.
composer test Consulte CONTRIBUCIÓN para obtener más detalles.
Si encuentra un error relacionado con la seguridad, envíe un correo electrónico a [email protected] en lugar de utilizar el rastreador de problemas.
Spatie es una agencia de diseño web con sede en Amberes, Bélgica. Encontrará una descripción general de todos nuestros proyectos de código abierto en nuestro sitio web.
La Licencia MIT (MIT). Consulte el archivo de licencia para obtener más información.