php readability
2.0.4
이것은이 전체 텍스트 -RSS 포크의 가독성 클래스의 추출물입니다. 원래 PHP 판독 성의 더 나은 버전으로 정의 할 수 있습니다.
기본 PHP- 읽기 LIB는 실제로 오래되었으며 개선해야합니다. @dither에서 가독성 클래스를 향상시키는 훌륭한 텍스트 -RSS의 훌륭한 포크를 발견했습니다.
php-cs-fixer 실행하고 네임 스페이스를 추가했습니다.그러나 코드는 여전히 이해 / 읽기가 정말 어렵습니다 ...
기본적 으로이 LIB는 사용 가능한 경우 깔끔한 확장을 사용합니다. Tidy는 주어진 HTML을 정리하고 나쁜 HTML 구조 등의 문제를 피하는 데만 사용됩니다. 작곡가가 제안합니다.
또한 깔끔한 설치없이 콘텐츠를 구문 분석하는 데 문제가있는 경우 설치하고 다시 시도하십시오.
use Readability Readability ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
// you can use whatever you want to retrieve the html content (Guzzle, Buzz, cURL ...)
$ html = file_get_contents ( $ url );
$ readability = new Readability ( $ html , $ url );
// or without Tidy
// $readability = new Readability($html, $url, 'libxml', false);
$ result = $ readability -> init ();
if ( $ result ) {
// display the title of the page
echo $ readability -> getTitle ()-> textContent ;
// display the *readability* content
echo $ readability -> getContent ()-> textContent ;
} else {
echo ' Looks like we couldn ' t find the content. :( ' ;
} 디버그하거나 무슨 일이 일어나고 있는지 확인하려면 로거를 주입 할 수 있습니다 (예 : PsrLogLoggerInterface , monolog를 따라야합니다) : :
use Readability Readability ;
use Monolog Logger ;
use Monolog Handler StreamHandler ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
$ html = file_get_contents ( $ url );
$ logger = new Logger ( ' readability ' );
$ logger -> pushHandler ( new StreamHandler ( ' path/to/your.log ' , Logger:: DEBUG ));
$ readability = new Readability ( $ html , $ url );
$ readability -> setLogger ( $ logger );