落伍的贴也看了很多了,发现了很多讲小偷技术的,如精华贴里的--小偷程序原理和简单示例:
[url]http://www.im286.com/viewthread.php?tid=407182&extra=page%3D1[/url]等等,也有提供采集程序下载的,但我还没看到一篇完整的入库的文章,或许是我看的贴少吧。虽然不是很深奥,我还是讲讲吧,希望高手别见笑啦,以前发了个原创的影视系
统,却没落伍,这次再求落伍啦,希望大家帮顶下,也希望我能落伍!!
入库也和小偷一样,要先得到需入库的部分,我这里以[url]http://www.skycn.com/article/77.html[/url]为例了
<%
dimurl,mydate
url="http://www.skycn.com/article/77.html"'定义url地址
SetOXML=server.CreateObject("Microsoft.XMLHTTP")
'下面定义两个函数,得到数据
PrivateFunctionBytesToBstr(body)'利用流进行中文编码
SetADOS=Server.CreateObject("ADODB.Stream")
DimBdat
Bdat=Body
ADOS.Type=1
ADOS.Mode=3
ADOS.Open
ADOS.WriteBdat
ADOS.Position=0
ADOS.Type=2
ADOS.Charset="GB2312"
BytesToBstr=ADOS.ReadText
ADOS.Close
EndFunction
PublicFunctionGetData(byrefurl)'利用OXML得到数据
'onerrorresumenext
SourceCode=OXML.open("GET",url,false)
OXML.send()
ifOXML.readystate<>4thenexitfunction
GetData=BytesToBstr(OXML.responseBody)'
iferr.number<>0thenerr.Clear
EndFunction
mydate=getdata(url)
mydate=Replace(mydate,chr(34),"")'去掉一些特殊字符,如双引号等,看自己情况定
mydate=Replace(mydate,chr(16),"")
response.writemydate
%>
我们就得到了以下的数据:
'''''''''''''''''''''''''codestart''''''''''''
省列去部分..............
href='../article/1034.html'>宽带用户需注意的七大安全</A><br><br></td></tr></table></td><td