Это было так популярно в последнее время, что я не люблю собирать, но я очень заинтересован в изучении принципов сбора. Я получил обычные функции для сбора онлайн, изучал их и практиковал их на практике. Результат был успешным. Откладывая проблему эффективности, принцип сбора не является сложным. Вы можете ввести «приобретение» в строку поиска, чтобы просмотреть его принципы. Вот пример коллекции:
Кода -копия выглядит следующим образом:
<%@Language = "vbscript" codepage = "65001"%>
<%Response.codepage = 65001%>
<%Response.charset = "UTF-8"%>
<%Server.scripttimeout = 99999999
response.expires = 0
response.expiresabsolute = теперь ()-1
ответ.
ответ.
Response.cachecontrol = "Без сэша"
%>
<%
«Объявите функцию для получения целевой информации и реализовать ее через компоненты XML.
Functiongeturl (url)
SetRetrieval = server.createObject ("msxml2.xmlhttp")
Безрельтивел
.Open "Get", URL, ложь
.Отправлять
If.status <> 200then 'определяет, был ли документ был проанализирован, чтобы клиент принял ответное сообщение
Выходная функция
Эндиф
'Двоичный к строке
Geturl = stb (. -Responsebody)
Энд
'Проверьте полученную информацию. Если длина информации меньше 100, это означает, что перехват не удался
Конечная функция
«Поверните двоичный к струне, в противном случае появится искаженная!
Functionstb (vin)
ConstadtyPetext = 2
DimbyTessTream, StringtRurn
SetByTessTream = server.createObject ("adodb.stream")
ВЫСОТКИЙ
.Type = adtypetext
.Открыть
.WriteTextvin
.Position = 0
.CHARSET = "GB2312"
.Position = 2
StringReturn = .ReadText
.Закрывать
Энд
SetByTessTream = ничего
stb = stringterurn
Конечная функция
FunctionNewString (WSTR, STRNG)
Newsstring = instr (Lcase (WSTR), Lcase (Strng))
IfnewString <= 0ThenNewString = Len (WSTR)
Конечная функция
'Объявите перехваченный формат, запустите с начала и конец из -за
Functiongetkey (html, start, over)
Start = Newstring (HTML, Start)
Over = Newstring (HTML, Over)
GetKey = mid (html, start, over-tart)
Конечная функция
DimSoftid, URL, HTML, заголовок
'Коллекция Baidu знает
Fori = 1to100
Url = "http://zhidao.baidu.com/question/10000" & i & ".html"
Html = geturl (url)
Вопрос = getKey (html, "<cq>", "</cq>")
Answer = getKey (html, "<aa>", "</ca>")
Response.write (Вопрос и "<br/>")