Ini adalah ekstrak dari kelas keterbacaan dari garpu rss-rss lengkap ini. Ini dapat didefinisikan sebagai versi yang lebih baik dari kemampuan-re-readabilitas asli.
Lib re-readability default sangat tua dan perlu ditingkatkan. Saya menemukan garpu bagus-teks-rss dari @dither yang meningkatkan kelas keterbacaan.
php-cs-fixer dan menambahkan namespaceTapi kodenya masih sangat sulit untuk dipahami / dibaca ...
Secara default, LIB ini akan menggunakan ekstensi rapi jika tersedia. Tidy hanya digunakan untuk membersihkan HTML yang diberikan dan menghindari masalah dengan struktur HTML yang buruk, dll. Ini akan disarankan oleh komposer.
Juga, jika Anda mendapat masalah dari parsing konten tanpa diinstal rapi, silakan instal dan coba lagi.
use Readability Readability ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
// you can use whatever you want to retrieve the html content (Guzzle, Buzz, cURL ...)
$ html = file_get_contents ( $ url );
$ readability = new Readability ( $ html , $ url );
// or without Tidy
// $readability = new Readability($html, $url, 'libxml', false);
$ result = $ readability -> init ();
if ( $ result ) {
// display the title of the page
echo $ readability -> getTitle ()-> textContent ;
// display the *readability* content
echo $ readability -> getContent ()-> textContent ;
} else {
echo ' Looks like we couldn ' t find the content. :( ' ;
} Jika Anda ingin men -debug, atau memeriksa apa yang terjadi, Anda dapat menyuntikkan logger (yang harus mengikuti PsrLogLoggerInterface , misalnya monolog):
use Readability Readability ;
use Monolog Logger ;
use Monolog Handler StreamHandler ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
$ html = file_get_contents ( $ url );
$ logger = new Logger ( ' readability ' );
$ logger -> pushHandler ( new StreamHandler ( ' path/to/your.log ' , Logger:: DEBUG ));
$ readability = new Readability ( $ html , $ url );
$ readability -> setLogger ( $ logger );