페이지의 html에 있는 텍스트 이외의 코드를 모두 제거하세요. 방금 출시된 PHP 버전은 ASP 버전입니다. ASP 함수 코드
다음과 같이 코드 코드를 복사합니다.
<%
기능 RemoveHTML(str)
희미한 objRegExp, Match,strHTML
isnull(str)이면
str=
종료하면
strHTML=str
strHTML=교체(교체(교체(strHTML,vblf,),vbcr,),vbcrlf,)
objRegExp = 새 Regexp 설정
objRegExp.IgnoreCase = 참
objRegExp.Global = 참
objRegExp.Pattern = <script[^>]*?>.*?</script>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <style[^>]*?>.*?</style>
strHTML = objRegExp.Replace(strHTML,)
objRegExp.Pattern = <.+?>
strHTML = objRegExp.Replace(strHTML,)
objRegExp = 없음으로 설정
제거HTML=strHTML
기능 종료
%>
PHP의 코드
다음과 같이 코드 코드를 복사합니다.
<?php
$search = array ('<script[^>]*?>.*?</script>'si, // 자바스크립트 제거
'<style[^>]*?>.*?</style>'si, // CSS 제거
'<[/!]*?[^<>]*?>'si, // HTML 태그 제거
'<!--[/!]*?[^<>]*?>'si, // 주석 표시를 제거합니다.
'([rn])[s]+', // 공백 문자 제거
'&(quot|#34);'i, // HTML 엔터티 교체
'&(amp|#38);'i,
'&(lt|#60);'i,
'&(gt|#62);'i,
'&(nbsp|#160);'i,
'&(iexcl|#161);'i,
'&(cent|#162);'i,
'&(파운드|#163);'i,
'&(복사|#169);'i,
'&#(d+);'e) // PHP 코드로 실행
$replace = 배열(,
,
,
,
/1,
/,
&,
<,
>,
,
문자(161),
문자(162),
문자(163),
문자(169),
문자(/1));
//$document는 처리해야 할 문자열입니다. 소스가 파일인 경우 $document = file_get_contents('http://www.sina.com.cn');
$out = preg_replace($search, $replace, $document);
에코 $out;
?>
그냥 get.php로 저장하세요.