Удалите любой код, кроме текста, в HTML на странице. Только что выпущенная версия PHP — это версия ASP. код функции asp
Скопируйте код кода следующим образом:
<%
Функция RemoveHTML(str)
Dim objRegExp, Match,strHTML
если isnull(str) тогда
ул=
конец, если
стрHTML=стр
strHTML = заменить (заменить (заменить (strHTML, vblf,), vbcr,), vbcrlf,)
Установить objRegExp = Новое регулярное выражение
objRegExp.IgnoreCase = Истина
objRegExp.Global = Истина
objRegExp.Pattern = <script[^>]*?>.*?</script>
стрHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <style[^>]*?>.*?</style>
стрHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <.+?>
стрHTML = objRegExp.Replace(strHTML,)
Установить objRegExp = Ничего
RemoveHTML=strHTML
Конечная функция
%>
код на php
Скопируйте код кода следующим образом:
<?php
$search = array ('<script[^>]*?>.*?</script>'si, // Удалить javascript
'<style[^>]*?>.*?</style>'si, // Удалить CSS
'<[/!]*?[^<>]*?>'si, // Удаление HTML-тегов
'<!--[/!]*?[^<>]*?>'si, // Удалить знак комментария
'([rn])[s]+', // Удаление пробелов
'&(quot|#34);'i, // Заменяем объект HTML
'&(amp|#38);'i,
'&(lt|#60);'i,
'&(gt|#62);'i,
'&(nbsp|#160);'i,
'&(iexcl|#161);'i,
'&(цент|#162);'i,
'&(фунт|#163);'i,
'&(копия|#169);'i,
'&#(d+);'e); // Запуск как код PHP
$replace = массив (,
,
,
,
/1,
/,
&,
<,
>,
,
хр(161),
хр(162),
хр(163),
хр(169),
чр(/1));
//$document — это строка, которую необходимо обработать. Если источником является файл, $document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($search, $replace, $document);
эхо $out;
?>
Просто сохраните его как get.php.