Outil de ligne de commande pour extraire le contenu principal d'une page Web, comme le fait la fonctionnalité "Reader View" de la plupart des navigateurs modernes. Il est destiné à être utilisé avec les lecteurs RSS Terminal, pour rendre les articles plus lisibles sur des navigateurs Web tels que Lynx. Le code est étroitement adapté de la version Firefox et la sortie devrait être principalement équivalente.
Cet outil est jeune et écrit en C, il est donc raisonnable de se demander le potentiel de problèmes de mémoire. Pour être en sécurité, tout l'analyse HTML se produit à l'intérieur d'un sous-processus en bac à sable. SecComp est utilisé à cet effet sur Linux, Spage sur OpenBSD et Capsicum sur FreeBSD.
Il y a trois dépendances directes: libxml2, libseccomp et libcurl. Sur Debian / Ubuntu, vous pouvez installer les deux premiers en fonctionnant (comme racine):
apt install libxml2-dev libseccomp-dev
Le package Libcurl est disponible en différentes saveurs, selon le backend qui fournit le support SSL. Chacun d'eux fera l'affaire. Pour installer la version gnutls:
apt install libcurl4-gnutls-dev
Pour que RDRVIEW soit utile, vous devez également obtenir un navigateur Web en mode de caractère tel que Lynx:
apt install lynx
Le nom des packages peut différer dans votre distribution. Sur Fedora, par exemple, vous pouvez tout installer avec:
dnf install libcurl-devel libxml2-devel libseccomp-devel lynx
Pour construire RDRView , juste CD à son répertoire et exécuter
make
Maintenant, il devrait être prêt à être utilisé. Vous pouvez essayer:
./rdrview 'https://github.com/eafer/rdrview'
Pour plus d'informations, consultez la page de l'homme:
man ./rdrview.1
Si vous trouvez RDRVIEW utile et que vous souhaitez l'installer, redevenir racine et exécuter
make install
Maintenant, vous pouvez simplement l'appeler avec rdrview et obtenir de l'aide avec man rdrview , comme vous le feriez pour tout autre outil de votre système.
Pour construire RDRView sur les BSD, vous aurez besoin de GNU Making ainsi que des bibliothèques. Avoir un navigateur de terminal disponible est recommandé. Sur OpenBSD, devenez root et courez
pkg_add gmake gcc libxml curl lynx
Sur freebsd, ce serait
pkg install gmake gcc libxml2 curl lynx
Vous pouvez maintenant CD dans le répertoire source et exécuter gmake pour la construction, et éventuellement gmake install pour l'installation. Les BSD ne fournissent aucun fichier MailCap par défaut, donc pour exécuter RDRVIEW, vous devrez spécifier le navigateur Web:
./rdrview -B lynx 'https://github.com/eafer/rdrview'
Je ne possède aucun ordinateur Apple pour tester cela moi-même, mais on m'a dit que RDRView s'appuie sur MacOS. Un bac à sable n'est pas encore implémenté, mais l'outil peut toujours être exécuté avec l'indicateur --disable-sandbox , tant que l'utilisateur comprend le risque.
RDRView a été écrit par Ernesto A. Fernández, mais c'est principalement une transpilation effectuée à la main de la lisibilité de Mozilla.js; qui était lui-même, selon leurs propres mots, "fortement basé sur la lisibilité d'Arc90.js". Ceci est la licence originale:
Copyright (c) 2010 Arc90 Inc
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.