Ha sido tan popular recientemente que no me gusta coleccionar, pero estoy muy interesado en investigar los principios de la recolección. Obtuve funciones comunes para la recolección en línea, las estudié y las practiqué en la práctica. El resultado fue exitoso. Dejando de lado el problema de eficiencia, el principio de recolección no es complicado. Puede ingresar "Adquisición" en la barra de búsqueda para ver sus principios. Aquí hay un ejemplo de colección:
La copia del código es la siguiente:
<%@Idioma = "vBscript" Codepage = "65001"%>
<%Respuesta.codepage = 65001%>
<%Respuesta.charset = "utf-8"%>
<%Server.scripttimeout = 999999999
respuesta.expires = 0
Respuesta.ExpeesabSolute = Now ()-1
Respuesta.AddHeader "Pragma", "No-Cache"
Respuesta.AddHeader "Cache-Control", "privado"
Respuesta.cacheControl = "No-cache"
%>
<%
'Declarar la función para obtener la información de destino e implementarla a través de componentes XML.
FunctEgetUrl (URL)
SetRetrieval = server.createObject ("msxml2.xmlhttp")
Withrrieval
.Preen "Get", url, falso
.Enviar
If.status <> 200 que 'determina si el documento ha sido analizado para que el cliente acepte el mensaje de retorno
extinción
Endif
'Binario a cadena
GetURL = stb (.ResponseBody)
fin
'Verifique la información obtenida. Si la longitud de la información es inferior a 100, significa que la intercepción falló
Función final
'Gire binario a una cuerda, ¡de lo contrario aparecerá el confusión!
FunctionStb (VIN)
ConstadTypetext = 2
DimbytesStream, stringreturn
SetByTestream = Server.CreateObject ("ADODB.Stream")
Con byteStream
.Type = adtypetext
.Abierto
.WriteTextvin
.Position = 0
.Charset = "GB2312"
.Position = 2
Stringreturn = .readText
.Cerca
Fin
SetByTesStream = nada
stb = stringreturn
Función final
FunctENewString (WSTR, STRNG)
Newsstring = Instr (lcase (WSTR), lcase (strng))
IfNewString <= 0ThennewString = Len (WSTR)
Función final
'Declarar el formato interceptado, comenzar desde el inicio y el final desde
FunctetKey (html, start, over)
Inicio = Newstring (html, inicio)
Over = Newstring (HTML, Over)
GetKey = Mid (HTML, Start, Extraart)
Función final
Dimsoftid, url, html, título
'Colección de Baidu sabe
Fori = 1to100
Url = "http://zhidao.baidu.com/question/10000" & i & ".html"
Html = getUrl (URL)
Pregunta = getKey (html, "<cq>", "</cq>")
Respuesta = getKey (html, "<ca>", "</ca>")
Response.write (Pregunta y "<br/>")