Il s'agit d'un extrait de la classe de lisibilité de cette fourchette à texte complet. Il peut être défini comme une meilleure version de la redabilité PHP d'origine.
La lib par défaut de redabilité PHP est vraiment ancienne et doit être améliorée. J'ai trouvé une excellente fourche de Text-Text-RSS de @Dher qui améliore la classe de lisibilité.
php-cs-fixer et ajouter un espace de nomsMais le code est encore très difficile à comprendre / lire ...
Par défaut, cette LIB utilisera l'extension radieuse si elle est disponible. Tidy n'est utilisé que pour nettoyer le HTML donné et éviter les problèmes avec une mauvaise structure HTML, etc. Il sera suggéré par le compositeur.
De plus, si vous avez des problèmes en analysant un contenu sans installer, veuillez l'installer et réessayer.
use Readability Readability ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
// you can use whatever you want to retrieve the html content (Guzzle, Buzz, cURL ...)
$ html = file_get_contents ( $ url );
$ readability = new Readability ( $ html , $ url );
// or without Tidy
// $readability = new Readability($html, $url, 'libxml', false);
$ result = $ readability -> init ();
if ( $ result ) {
// display the title of the page
echo $ readability -> getTitle ()-> textContent ;
// display the *readability* content
echo $ readability -> getContent ()-> textContent ;
} else {
echo ' Looks like we couldn ' t find the content. :( ' ;
} Si vous souhaitez le déboguer ou vérifier ce qui se passe, vous pouvez injecter un enregistreur (qui doit suivre PsrLogLoggerInterface , monologue par exemple):
use Readability Readability ;
use Monolog Logger ;
use Monolog Handler StreamHandler ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
$ html = file_get_contents ( $ url );
$ logger = new Logger ( ' readability ' );
$ logger -> pushHandler ( new StreamHandler ( ' path/to/your.log ' , Logger:: DEBUG ));
$ readability = new Readability ( $ html , $ url );
$ readability -> setLogger ( $ logger );