php readability
2.0.4
これは、このフルテキストRSSフォークからの読みやすさのクラスの抽出です。これは、元のPHP読みやすさのより良いバージョンとして定義できます。
デフォルトのPHP-ReadabilityLIBは本当に古く、改善する必要があります。 @ditherからフルテキストRSSの素晴らしいフォークを見つけました。
php-cs-fixerを実行し、名前空間を追加しましたしかし、コードはまだ理解 /読むのが本当に難しいです...
デフォルトでは、このLIBは利用可能な場合はきちんとした拡張機能を使用します。 Tidyは、指定されたHTMLをクリーンアップし、HTML構造の不良などの問題を回避するためにのみ使用されます。これは、Composerによって提案されます。
また、整頓されたインストールなしでコンテンツを解析することで問題が発生した場合は、インストールして再試行してください。
use Readability Readability ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
// you can use whatever you want to retrieve the html content (Guzzle, Buzz, cURL ...)
$ html = file_get_contents ( $ url );
$ readability = new Readability ( $ html , $ url );
// or without Tidy
// $readability = new Readability($html, $url, 'libxml', false);
$ result = $ readability -> init ();
if ( $ result ) {
// display the title of the page
echo $ readability -> getTitle ()-> textContent ;
// display the *readability* content
echo $ readability -> getContent ()-> textContent ;
} else {
echo ' Looks like we couldn ' t find the content. :( ' ;
}デバッグしたい場合、または何が起こっているのかを確認する場合は、ロガーを挿入できます( PsrLogLoggerInterface 、Monologなど):
use Readability Readability ;
use Monolog Logger ;
use Monolog Handler StreamHandler ;
$ url = ' http://www.medialens.org/index.php/alerts/alert-archive/alerts-2013/729-thatcher.html ' ;
$ html = file_get_contents ( $ url );
$ logger = new Logger ( ' readability ' );
$ logger -> pushHandler ( new StreamHandler ( ' path/to/your.log ' , Logger:: DEBUG ));
$ readability = new Readability ( $ html , $ url );
$ readability -> setLogger ( $ logger );