PDFgrep est un outil pour rechercher du texte dans les fichiers PDF. Il fonctionne de manière similaire à Grep .
-r , -i , -n ou -c ).Pour une documentation complète, veuillez consulter la page Man.
$ pdfgrep --max-count 1 --context 1 --with-filename --page-number pattern rabin-karp.pdf
rabin-karp.pdf-1-randomized
rabin-karp.pdf:1:pattern-matching
rabin-karp.pdf-1-algorithms
Pour construire pdfgrep , utilisez la procédure standard:
./configure
make
sudo make install
Si vous utilisez la version git, vous devrez également exécuter ./autogen.sh à l'avance.
Selon votre système d'exploitation, vous devez avoir des packages -dev ou -devel installés pour toutes les dépendances.
Le script ./configure peut prendre beaucoup d'options pour personnaliser le processus de construction, dont les plus importants sont:
--with-unac : construire avec le support expérimental de libunac et ajouter l'indicateur --unac à pdfgrep qui dépouille tous les accents des caractères, ce qui permet de trouver le caractère 'ä' en recherchant `` a '.--with-{zsh,bash}-completion : configurer le répertoire d'installation pour les fichiers d'achèvement de shell.--without-libpcre : désactiver le support pour les expressions régulières compatibles Perl.--disable-doc : Désactiver la génération de pages manuels. Pour désinstaller, courez sudo make uninstall .
Voir configure --help pour plus d'informations ou lire le fichier INSTALL (très étendu) dans la source.
Des tarball pour les sorties sont disponibles sur https://pdfgrep.org/download.html
La version de développement est disponible en tant que référentiel GIT à https://gitlab.com/pdfgrep/pdfgrep
Des questions générales, des suggestions, des rapports de bogues, des correctifs ou toute autre chose peuvent être envoyés à la liste de diffusion.
Vous pouvez également utiliser le tracker de problème pour les rapports de bogues ou créer une demande de fusion sur GitLab, si vous préférez cela par rapport aux listes de diffusion.