Этот пакет предоставляет класс для извлечения текста из PDF-файла.
use Spatie PdfToText Pdf ;
echo Pdf:: getText ( ' book.pdf ' ); //returns the text from the pdfSpatie — агентство веб-дизайна, базирующееся в Антверпене, Бельгия. На нашем сайте вы найдете обзор всех наших проектов с открытым исходным кодом.
Мы вкладываем много ресурсов в создание лучших в своем классе пакетов с открытым исходным кодом. Вы можете поддержать нас, купив один из наших платных продуктов.
Мы очень признательны вам за отправку нам открытки из вашего родного города с указанием того, какой из наших пакетов вы используете. Наш адрес вы найдете на странице контактов. Все полученные открытки мы публикуем на нашей виртуальной стене открыток.
За кулисами этот пакет использует pdftotext. Вы можете проверить, установлен ли двоичный файл в вашей системе, выполнив следующую команду:
which pdftotextЕсли он установлен, он вернет путь к двоичному файлу.
Чтобы установить двоичный файл, вы можете использовать эту команду в Ubuntu или Debian:
apt-get install poppler-utilsНа Mac вы можете установить двоичный файл с помощью Brew.
brew install popplerЕсли вы используете RedHat, CentOS, Rocky Linux или Fedora, используйте это:
yum install poppler-utilsВы можете установить пакет через композитор:
composer require spatie/pdf-to-textИзвлечь текст из PDF-файла легко.
$ text = ( new Pdf ())
-> setPdf ( ' book.pdf ' )
-> text ();Или проще:
echo Pdf:: getText ( ' book.pdf ' ); По умолчанию пакет предполагает, что команда pdftotext находится в /usr/bin/pdftotext . Если он находится в другом месте, передайте его двоичный путь конструктору.
$ text = ( new Pdf ( ' /custom/path/to/pdftotext ' ))
-> setPdf ( ' book.pdf ' )
-> text (); или в качестве второго параметра статического метода getText :
echo Pdf:: getText ( ' book.pdf ' , ' /custom/path/to/pdftotext ' ); Иногда вам может потребоваться использовать параметры pdftotext. Для этого вы можете настроить их с помощью метода setOptions .
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> text ()
; или в качестве третьего параметра статического метода getText :
echo Pdf:: getText ( ' book.pdf ' , null , [ ' layout ' , ' opw myP1$$Word ' ]); Обратите внимание, что последующие вызовы setOptions() перезапишут параметры, переданные во время предыдущих вызовов.
Если вам нужно выполнить несколько вызовов для добавления параметров (например, если вам нужно передать параметры по умолчанию при создании объекта Pdf из контейнера, а затем добавить контекстно-зависимые параметры в другом месте), вы можете использовать метод addOptions() :
$ text = ( new Pdf ())
-> setPdf ( ' table.pdf ' )
-> setOptions ([ ' layout ' , ' r 96 ' ])
-> addOptions ([ ' f 1 ' ])
-> text ()
;Пожалуйста, посетите CHANGELOG для получения дополнительной информации о том, что изменилось за последнее время.
composer test Пожалуйста, смотрите ВКЛАД для получения подробной информации.
Если вы обнаружили ошибку, связанную с безопасностью, отправьте электронное письмо по адресу [email protected] вместо использования системы отслеживания проблем.
Spatie — агентство веб-дизайна, базирующееся в Антверпене, Бельгия. На нашем сайте вы найдете обзор всех наших проектов с открытым исходным кодом.
Лицензия MIT (MIT). Пожалуйста, смотрите файл лицензии для получения дополнительной информации.