นี่คือสารสกัดของคลาสความสามารถในการอ่านจาก Full-text-RSS นี้ มันสามารถกำหนดเป็นเวอร์ชันที่ดีกว่าของความสามารถในการอ่าน PHP ดั้งเดิม
LIB ความสามารถในการอ่าน PHP เริ่มต้นนั้นเก่ามากและจำเป็นต้องได้รับการปรับปรุง ฉันพบส้อมที่ยอดเยี่ยมของ Full-text-RSS จาก @dither ซึ่งปรับปรุงคลาสการอ่าน
php-cs-fixer และเพิ่มเนมสเปซแต่ รหัสยังคงยากที่จะเข้าใจ / อ่าน ...
โดยค่าเริ่มต้น LIB นี้จะใช้ส่วนขยายที่เป็นระเบียบหากมีอยู่ เป็นระเบียบใช้ในการทำความสะอาด HTML ที่กำหนดเท่านั้นและหลีกเลี่ยงปัญหาเกี่ยวกับโครงสร้าง HTML ที่ไม่ดี ฯลฯ .. มันจะได้รับการแนะนำโดยนักแต่งเพลง
นอกจากนี้หากคุณมีปัญหาจากการแยกวิเคราะห์เนื้อหาโดยไม่ต้องติดตั้งเป็นระเบียบโปรดติดตั้งและลองอีกครั้ง
use Readability Readability ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
// you can use whatever you want to retrieve the html content (Guzzle, Buzz, cURL ...)
$ html = file_get_contents ( $ url );
$ readability = new Readability ( $ html , $ url );
// or without Tidy
// $readability = new Readability($html, $url, 'libxml', false);
$ result = $ readability -> init ();
if ( $ result ) {
// display the title of the page
echo $ readability -> getTitle ()-> textContent ;
// display the *readability* content
echo $ readability -> getContent ()-> textContent ;
} else {
echo ' Looks like we couldn ' t find the content. :( ' ;
} หากคุณต้องการแก้ไขข้อบกพร่องหรือตรวจสอบสิ่งที่เกิดขึ้นคุณสามารถฉีดเครื่องบันทึก (ซึ่งต้องติดตาม PsrLogLoggerInterface , monolog เป็นต้น):
use Readability Readability ;
use Monolog Logger ;
use Monolog Handler StreamHandler ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
$ html = file_get_contents ( $ url );
$ logger = new Logger ( ' readability ' );
$ logger -> pushHandler ( new StreamHandler ( ' path/to/your.log ' , Logger:: DEBUG ));
$ readability = new Readability ( $ html , $ url );
$ readability -> setLogger ( $ logger );