Una breve discusión sobre el principio del programa de adquisición de ASP

Autor：Eve Cole Fecha de actualización：2025-04-12 04:16:02

Recomendado: ASP y enlace de acceso
Este artículo ilustra dos formas de vincular ASP y acceso en ejemplos de ASP. El siguiente es el contenido referenciado: %Dim DD, Connstrdd = data.mdbconnstr = & Q

Los pasos principales del procedimiento de recolección son los siguientes:

1. Obtenga el contenido de la página recopilada

2. Extraiga todos los datos utilizados del código de adquisición

1. Obtenga el contenido de la página recopilada

Actualmente conozco los métodos de uso común para obtener páginas recolectadas en ASP:

1. Use el componente ServerXMLHTTP para obtener datos

El siguiente contenido es el código del programa:

El siguiente es el contenido citado:

Function getBody (weburl)

'Crea un objeto

Dim objxmlhttp

Establecer objxmlhttp = server.createObject (msxml2.serverxmlhttp)

'Archivo de solicitud, en forma asincrónica

Objxmlhttp.open get, webuurl, falso

Objxmlhttp.send

Mientras objxmlhttp.readyState <> 4

Objxmlhttp.waitForResponse 1000

Encaminarse a

'Obtenga el resultado

GetBody = objxmlhttp.ResponseBody

'Libera el objeto

Establecer objxmlhttp = nada

Función final

Método de llamadas:

GetBody (la dirección URLF del archivo)

2. O componente XMLHTTP para obtener datos

El siguiente contenido es el código del programa:

El siguiente es el contenido citado:

Function getBody (weburl)

'Crea un objeto

Establecer recuperación = createObject (Microsoft.xmlhttp)

Con recuperación

.Open get, weburl, falso,

.Enviar

GetBody = .ResponseBody

Terminar con

'Libera el objeto

Establecer recuperación = nada

Función final

Método de llamadas:

GetBody (la dirección URLF del archivo)

Los datos obtenidos de esta manera también deben codificarse y convertirse antes de que pueda usarse

El siguiente contenido es el código del programa:

El siguiente es el contenido citado:

Función bytestobstr (cuerpo, cset)

dim objstream

Establecer objstream = server.createObject (ADODB.Stream)

objstream.type = 1

objstream.mode = 3

objstream.

objstream.write cuerpo

objstream.position = 0

objstream.type = 2

objstream.charset = cset

Bytestobstr = objstream.readText

objstream.close

establecer objstream = nada

Función final

Método de llamadas: la codificación de ByTestobstr (datos a convertir, codificar) 'se usa comúnmente como GB2312 y UTF-8

2. Extraiga todos los datos utilizados del código de adquisición

Los métodos que he dominado son:

1. Use la función media incorporada de ASP para interceptar los datos requeridos

El siguiente contenido es el código del programa:

Funcion Body (WSTR, Start, Over)

inicio = Newstring (WSTR, inicio)

'Establezca la marca de inicio única para los datos que se procesan

Over = Newstring (WSTR, Over)

'El inicio correspondiente es la única marca final de los datos que se procesan

Body = Mid (WSTR, Start, Sobrevalt)

'Establezca el alcance de la página que se muestra

Función final

Método de llamadas: cuerpo (el contenido de la página recopilada, la marca de inicio, la marca final)

2. Use regularidad para obtener los datos requeridos

El siguiente contenido es el código del programa:

Funcion Body (WSTR, Start, Over)

Establecer xiaoqi = nuevo objeto de configuración de Regexp'Set

xiaoqi.ignorecase = true 'ignorar el caso

xiaoqi.global = true 'establecido como búsqueda de texto completo

xiaoqi.pattern = & start &. ? & Over & 'Expresión regular

Establecer coincidencias = xiaoqi.execute (wstr) 'Inicie la ejecución de la configuración

establecer xiaoqi = nada

cuerpo =

Para cada partido en partidos

Body = Body & Match.Value 'Loop Match

Función final

Método de llamadas: cuerpo (el contenido de la página recopilada, la marca de inicio, la marca final)

Recopilar procedimientos e ideas detalladas:

1. Obtenga la dirección de cada página de la página de la página de la lista de paginación del sitio web

Actualmente, la mayoría de los sitios web dinámicos tienen reglas para las direcciones de paginación, como:

Página dinámica

Página 1: Index.asp? Página = 1

Página 2: Index.asp? Página = 2

Página 3: Index.asp? Página = 3

.....

Página estática

Página 1: Page_1.htm

Página 2: Page_2.htm

Página 3: Page_3.htm

.....

Obtenga la dirección de cada página de la página de la página de la lista de paginación del sitio web, solo necesita reemplazar los caracteres que cambian la dirección de cada página con variables, como: página _ <%= & página y%>. Htm

2. Obtenga el contenido de la página de la página del sitio web recopilado

3. Extraiga la dirección de conexión de URL de la página de contenido recopilado desde el código de la lista de paginación

También hay reglas fijas para conectar páginas de contenido en la mayoría de las páginas de paginación, como:

Conectar 1

Conectar 2

Conexión 3

Use el siguiente código para obtener una colección de conexión de URL

El siguiente contenido es el código del programa:

El siguiente es el contenido citado:

Establecer xiaoqi = nuevo regexp

xiaoqi.ignorecase = true

xiaoqi.global = verdadero

xiaoqi.pattern =. ?

Establecer coincidencias = xiaoqi.execute (contenido de la lista de páginas)

establecer xiaoqi = nada

url =

Para cada partido en partidos

url = url y match.value

4. Obtenga el contenido de la página de contenido recopilado e intercepte los datos que se obtendrán de la página de contenido recopilado de acuerdo con la marca de extracción.

Debido a que es una página generada dinámicamente, la mayoría de las páginas de contenido tienen las mismas etiquetas HTML, y podemos extraer el contenido de cada parte del contenido requerido en función de estas etiquetas regulares.

como:

Cada página tiene un título de página web. Puede obtener los valores entre ellos utilizando la función de intercepción media que escribí anteriormente, o puede obtenerlos con expresiones regulares.

Ejemplo: cuerpo (,)

Compartir: Cómo usar ASP para personalizar sus propios métodos de lectura y escritura de archivos XML
Antes de esto, escribí dos publicaciones sobre ASP combinando XML, introduciendo las tecnologías de reemplazar bases de datos con XML e integrar bases de datos con XML, para que las bases de datos ya no sean nuestra única opción en algunos casos. En comparación con las bases de datos tradicionales, XML tiene las siguientes ventajas