In letzter Zeit war es in letzter Zeit so beliebt, dass ich nicht gerne sammle, aber ich bin sehr daran interessiert, die Prinzipien der Sammlung zu erforschen. Ich bekam gemeinsame Funktionen für die Online -Sammlung, studierte sie und praktizierte sie in der Praxis. Das Ergebnis war erfolgreich. Abgesehen von der Effizienzprobleme ist das Sammelprinzip nicht kompliziert. Sie können in der Suchleiste "Akquisition" eingeben, um die Prinzipien anzuzeigen. Hier ist ein Beispiel für die Sammlung:
Die Codekopie lautet wie folgt:
<%@Sprache = "vbscript" Codepage = "65001"%>
<%Antwort.CodePage = 65001%>
<%Response.charset = "utf-8"%>
<%Server.ScriptTimeout = 999999999
response.expires = 0
response.expiresabsolute = jetzt ()-1
response.addHeader "Pragma", "No-Cache"
response.addHeader "Cache-Control", "privat"
Response.cachecontrol = "no-cache"
%>
<%
„Deklarieren Sie die Funktion, um die Zielinformationen zu erhalten, und implementieren Sie sie über XML -Komponenten.
Functionurl (URL)
SetRevalal = server.createObject ("msxml2.xmlhttp"))
Withrieval
.Open "GET", URL, falsch
.Schicken
If.Status <> 200Then 'bestimmt, ob das Dokument analysiert wurde, damit der Client die Rückgabenachricht akzeptiert
Ausgangsfunktion
Endif
'Binär zu String
Geturl = STB (.ResponseBody)
Endwith
»Überprüfen Sie die erhaltenen Informationen. Wenn die Informationslänge weniger als 100 beträgt, bedeutet dies, dass das Abfangen fehlgeschlagen ist
Endfunktion
'Binär zu String, ansonsten wird verstümmelt!
Funktionstb (Vin)
Constadtypetext = 2
Dimbytessstream, StringReturn
SetByTesTream = server.createObject ("adodb.stream")
Mit Bytessstream
.Type = adtyPext
.Offen
.WritETextVin
.Position = 0
.CharSet = "GB2312"
.Position = 2
StringReturn = .ReadText
.Schließen
Endwith
SetByTesTream = nichts
STB = StringReturn
Endfunktion
FunktionNewstring (WSTR, STRNG)
NewsString = Instring (Lase (WSTR), Lase (strng))
Ifnewstring <= 0Thenwstring = len (WSTR)
Endfunktion
'Deklarieren Sie das abgefangene Format, beginnen Sie von Anfang und Ende von Over
FORMITIONKEY (HTML, START, OVER)
Start = Newsstring (HTML, Start)
Over = Newsstring (HTML, Over)
GetKey = Mid (HTML, Start, Überstart)
Endfunktion
Dimsoftid, URL, HTML, Titel
'Sammlung von Baidu weiß
Fei = 1 bis 100
Url = "http://zhidao.baidu.com/question/10000" & i & ".html"
Html = geturl (URL)
Frage = getKey (html, "<cq>", "</cq>")
Antwort = getKey (html, "<ca>", "</ca>")
Antwort.Write (Frage & "<br/>")