Elimine qualquer código que não seja texto no html da página. A versão php recém-lançada é a versão em ASP. código de função asp
Copie o código do código da seguinte forma:
<%
Função RemoveHTML(str)
Dim objRegExp, Match,strHTML
se for nulo(str) então
str =
terminar se
strHTML=str
strHTML=substituir(substituir(substituir(strHTML,vblf,),vbcr,),vbcrlf,)
Definir objRegExp = Novo Regexp
objRegExp.IgnoreCase = Verdadeiro
objRegExp.Global = Verdadeiro
objRegExp.Pattern = <script[^>]*?>.*?</script>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <estilo[^>]*?>.*?</style>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <.+?>
strHTML = objRegExp.Replace(strHTML,)
Definir objRegExp = Nada
RemoverHTML=strHTML
Função final
%>
código em php
Copie o código do código da seguinte forma:
<?php
$search = array ('<script[^>]*?>.*?</script>'si, // Remover javascript
'<style[^>]*?>.*?</style>'si, // Remover css
'<[/!]*?[^<>]*?>'si, // Remover tags HTML
'<!--[/!]*?[^<>]*?>'si, // Remova a marca de comentário
'([rn])[s]+', // Remove caracteres de espaço em branco
'&(quot|#34);'i, // Substituir entidade HTML
'&(amp|#38);'eu,
'&(lt|#60);'eu,
'&(gt|#62);'eu,
'&(nbsp|#160);'eu,
'&(iexcl|#161);'eu,
'&(cent|#162);'eu,
'&(libra|#163);'eu,
'&(copiar|#169);'eu,
'&#(d+);'e); // Executa como código PHP
$substituir = array (,
,
,
,
/1,
/,
&,
<,
>,
,
cr(161),
cr(162),
cr(163),
cr(169),
ch(/1));
//$document é uma string que precisa ser processada. Se a fonte for um arquivo, $document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($pesquisar, $substituir, $documento);
echo $out;
?>
Basta salvá-lo como get.php.