Recomendado: ASP y enlace de acceso Este artículo ilustra dos formas de vincular ASP y acceso en ejemplos de ASP. El siguiente es el contenido referenciado: %Dim DD, Connstrdd = data.mdbconnstr = & Q
Los pasos principales del procedimiento de recolección son los siguientes:
1. Obtenga el contenido de la página recopilada
2. Extraiga todos los datos utilizados del código de adquisición
1. Obtenga el contenido de la página recopilada
Actualmente conozco los métodos de uso común para obtener páginas recolectadas en ASP:
1. Use el componente ServerXMLHTTP para obtener datos
El siguiente contenido es el código del programa:
| El siguiente es el contenido citado: Function getBody (weburl) 'Crea un objeto Dim objxmlhttp Establecer objxmlhttp = server.createObject (msxml2.serverxmlhttp) 'Archivo de solicitud, en forma asincrónica Objxmlhttp.open get, webuurl, falso Objxmlhttp.send Mientras objxmlhttp.readyState <> 4 Objxmlhttp.waitForResponse 1000 Encaminarse a 'Obtenga el resultado GetBody = objxmlhttp.ResponseBody 'Libera el objeto Establecer objxmlhttp = nada Función final |
Método de llamadas:
GetBody (la dirección URLF del archivo)
2. O componente XMLHTTP para obtener datos
El siguiente contenido es el código del programa:
| El siguiente es el contenido citado: Function getBody (weburl) 'Crea un objeto Establecer recuperación = createObject (Microsoft.xmlhttp) Con recuperación .Open get, weburl, falso, .Enviar GetBody = .ResponseBody Terminar con 'Libera el objeto Establecer recuperación = nada Función final |
Método de llamadas:
GetBody (la dirección URLF del archivo)
Los datos obtenidos de esta manera también deben codificarse y convertirse antes de que pueda usarse
El siguiente contenido es el código del programa:
| El siguiente es el contenido citado: Función bytestobstr (cuerpo, cset) dim objstream Establecer objstream = server.createObject (ADODB.Stream) objstream.type = 1 objstream.mode = 3 objstream. objstream.write cuerpo objstream.position = 0 objstream.type = 2 objstream.charset = cset Bytestobstr = objstream.readText objstream.close establecer objstream = nada Función final |
Método de llamadas: la codificación de ByTestobstr (datos a convertir, codificar) 'se usa comúnmente como GB2312 y UTF-8
2. Extraiga todos los datos utilizados del código de adquisición
Los métodos que he dominado son:
1. Use la función media incorporada de ASP para interceptar los datos requeridos
El siguiente contenido es el código del programa:
Funcion Body (WSTR, Start, Over)
inicio = Newstring (WSTR, inicio)
'Establezca la marca de inicio única para los datos que se procesan
Over = Newstring (WSTR, Over)
'El inicio correspondiente es la única marca final de los datos que se procesan
Body = Mid (WSTR, Start, Sobrevalt)
'Establezca el alcance de la página que se muestra
Función final
Método de llamadas: cuerpo (el contenido de la página recopilada, la marca de inicio, la marca final)
2. Use regularidad para obtener los datos requeridos
El siguiente contenido es el código del programa:
Funcion Body (WSTR, Start, Over)
Establecer xiaoqi = nuevo objeto de configuración de Regexp'Set
xiaoqi.ignorecase = true 'ignorar el caso
xiaoqi.global = true 'establecido como búsqueda de texto completo
xiaoqi.pattern = & start &. ? & Over & 'Expresión regular
Establecer coincidencias = xiaoqi.execute (wstr) 'Inicie la ejecución de la configuración
establecer xiaoqi = nada
cuerpo =
Para cada partido en partidos
Body = Body & Match.Value 'Loop Match
Próximo
Función final
Método de llamadas: cuerpo (el contenido de la página recopilada, la marca de inicio, la marca final)
Recopilar procedimientos e ideas detalladas:
1. Obtenga la dirección de cada página de la página de la página de la lista de paginación del sitio web
Actualmente, la mayoría de los sitios web dinámicos tienen reglas para las direcciones de paginación, como:
Página dinámica
Página 1: Index.asp? Página = 1
Página 2: Index.asp? Página = 2
Página 3: Index.asp? Página = 3
.....
Página estática
Página 1: Page_1.htm
Página 2: Page_2.htm
Página 3: Page_3.htm
.....
Obtenga la dirección de cada página de la página de la página de la lista de paginación del sitio web, solo necesita reemplazar los caracteres que cambian la dirección de cada página con variables, como: página _ <%= & página y%>. Htm
2. Obtenga el contenido de la página de la página del sitio web recopilado
3. Extraiga la dirección de conexión de URL de la página de contenido recopilado desde el código de la lista de paginación
También hay reglas fijas para conectar páginas de contenido en la mayoría de las páginas de paginación, como:
Conectar 1
Conectar 2
Conexión 3
Use el siguiente código para obtener una colección de conexión de URL
El siguiente contenido es el código del programa:
| El siguiente es el contenido citado: Establecer xiaoqi = nuevo regexp xiaoqi.ignorecase = true xiaoqi.global = verdadero xiaoqi.pattern =. ? Establecer coincidencias = xiaoqi.execute (contenido de la lista de páginas) establecer xiaoqi = nada url = Para cada partido en partidos url = url y match.value Próximo |
4. Obtenga el contenido de la página de contenido recopilado e intercepte los datos que se obtendrán de la página de contenido recopilado de acuerdo con la marca de extracción.
Debido a que es una página generada dinámicamente, la mayoría de las páginas de contenido tienen las mismas etiquetas HTML, y podemos extraer el contenido de cada parte del contenido requerido en función de estas etiquetas regulares.
como:
Cada página tiene un título de página web. Puede obtener los valores entre ellos utilizando la función de intercepción media que escribí anteriormente, o puede obtenerlos con expresiones regulares.
Ejemplo: cuerpo (,)
Compartir: Cómo usar ASP para personalizar sus propios métodos de lectura y escritura de archivos XML Antes de esto, escribí dos publicaciones sobre ASP combinando XML, introduciendo las tecnologías de reemplazar bases de datos con XML e integrar bases de datos con XML, para que las bases de datos ya no sean nuestra única opción en algunos casos. En comparación con las bases de datos tradicionales, XML tiene las siguientes ventajas