Éliminez tout code autre que le texte dans le code HTML de la page. La version php qui vient de sortir est la version en ASP. code de fonction asp
Copiez le code comme suit :
<%
Fonction SupprimerHTML(str)
Dim objRegExp, Match, strHTML
si est nul (str) alors
str=
finir si
strHTML=chaîne
strHTML=remplacer(remplacer(remplacer(strHTML,vblf,),vbcr,),vbcrlf,)
Définir objRegExp = Nouvelle expression rationnelle
objRegExp.IgnoreCase = True
objRegExp.Global = Vrai
objRegExp.Pattern = <script[^>]*?>.*?</script>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <style[^>]*?>.*?</style>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <.+?>
strHTML = objRegExp.Replace(strHTML,)
Définir objRegExp = Rien
SupprimerHTML=strHTML
Fonction de fin
%>
code en php
Copiez le code comme suit :
<?php
$search = array ('<script[^>]*?>.*?</script>'si, // Supprimer javascript
'<style[^>]*?>.*?</style>'si, // Supprimer le CSS
'<[/!]*?[^<>]*?>'si, // Supprimer les balises HTML
'<!--[/!]*?[^<>]*?>'si, // Supprime la marque de commentaire
'([rn])(s]+', // Supprime les caractères d'espacement
'&(quot|#34);'i, // Remplacer l'entité HTML
'&(amp|#38);'je,
'&(lt|#60);'je,
'&(gt|#62);'je,
'&(nbsp|#160);'je,
'&(iexcl|#161);'je,
'&(cent|#162);'je,
'&(livre|#163);'i,
'&(copie|#169);'i,
'&#(d+);'e); // Exécuter en tant que code PHP
$replace = tableau (,
,
,
,
/1,
/,
&,
<,
>,
,
chr(161),
chr(162),
chr(163),
chr(169),
chr(/1));
//$document est une chaîne qui doit être traitée. Si la source est un fichier, $document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($search, $replace, $document);
écho $out;
?>
Enregistrez-le simplement sous get.php.