Elimina cualquier código que no sea texto en el html de la página. La versión php recién lanzada es la versión en ASP. código de función asp
Copie el código de código de la siguiente manera:
<%
Función Eliminar HTML (cadena)
Dim objRegExp, Match, strHTML
si es nulo (cadena) entonces
cadena =
terminar si
cadenaHTML=cadena
strHTML=reemplazar(reemplazar(reemplazar(strHTML,vblf,),vbcr,),vbcrlf,)
Establecer objRegExp = Nueva expresión regular
objRegExp.IgnoreCase = Verdadero
objRegExp.Global = Verdadero
objRegExp.Pattern = <script[^>]*?>.*?</script>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <estilo[^>]*?>.*?</estilo>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Patrón = <.+?>
strHTML = objRegExp.Replace(strHTML,)
Establecer objRegExp = Nada
EliminarHTML=strHTML
Función final
%>
codigo en php
Copie el código de código de la siguiente manera:
<?php
$búsqueda = array ('<script[^>]*?>.*?</script>'si, // Eliminar javascript
'<estilo[^>]*?>.*?</estilo>'si, // Eliminar css
'<[/!]*?[^<>]*?>'si, // Eliminar etiquetas HTML
'<!--[/!]*?[^<>]*?>'si, // Elimina la marca de comentario
'([rn])[s]+', // Elimina los espacios en blanco
'&(quot|#34);'i, // Reemplazar entidad HTML
'&(amp|#38);'yo,
'&(lt|#60);'yo,
'&(gt|#62);'yo,
'&(nbsp|#160);'yo,
'&(iexcl|#161);'yo,
'&(centavo|#162);'i,
'&(libra|#163);'yo,
'&(copia|#169);'yo,
'&#(d+);'e); // Ejecutar como código PHP
$reemplazar = matriz (,
,
,
,
/1,
/,
&,
<,
>,
,
chr(161),
canal(162),
chr(163),
canal(169),
chr(/1));
//$document es una cadena que debe procesarse. Si la fuente es un archivo, $document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($búsqueda, $reemplazar, $documento);
eco $salida;
?>
Simplemente guárdelo como get.php.