Eine kurze Diskussion über das Prinzip des ASP -Akquisitionsprogramms

Autor：Eve Cole Aktualisierungszeit：2025-04-12 04:16:02

Empfohlen: ASP und Zugriffslink
Dieser Artikel zeigt zwei Möglichkeiten zur Verknüpfung von ASP und Zugriff in ASP -Beispielen. Im Folgenden ist der in Bezug

Die Hauptschritte des Sammelverfahrens sind wie folgt:

1. Ermitteln Sie den Inhalt der gesammelten Seite

2. Extrahieren Sie alle Daten aus dem Erfassungscode

1. Ermitteln Sie den Inhalt der gesammelten Seite

Ich kenne derzeit die häufig verwendeten Methoden, um gesammelte Seiten in ASP zu erhalten:

1. Verwenden Sie die ServerxmlHTTP -Komponente, um Daten zu erhalten

Der folgende Inhalt ist der Programmcode:

Das Folgende ist der zitierte Inhalt:

Funktion Getbody (Weburl)

'Erstellen Sie ein Objekt

Dimer objxmlhttp

Setzen Sie objxmlhttp = server.createObject (msxml2.ServerxMlhttp)

'Anfragedatei in asynchroner Form anfordern

Objxmlhttp.open GET, Webuurl, Falsch

Objxmlhttp.send

Während objxmlhttp.readystate <> 4

Objxmlhttp.waitforresponse 1000

Wend

'Holen Sie sich das Ergebnis

GetBody = objxmlhttp.ResponseBody

'Lust das Objekt

Setzen Sie objxmlhttp = nichts

Endfunktion

Aufrufmethode:

Getbody (die URLF -Adresse der Datei)

2. oder XMLHTTP -Komponente, um Daten zu erhalten

Der folgende Inhalt ist der Programmcode:

Das Folgende ist der zitierte Inhalt:

Funktion Getbody (Weburl)

'Erstellen Sie ein Objekt

Set Retrieval = createObject (microsoft.xmlhttp)

Mit Abruf

.Open bekommen, weburl, falsch,,

.Schicken

Getbody = .ResponseBody

Enden mit

'Lust das Objekt

Retrieval einstellen = nichts

Endfunktion

Aufrufmethode:

Getbody (die URLF -Adresse der Datei)

Die auf diese Weise erhaltenen Daten müssen auch codiert und konvertiert werden, bevor sie verwendet werden können

Der folgende Inhalt ist der Programmcode:

Das Folgende ist der zitierte Inhalt:

Funktion byTestObstr (Körper, cset)

Dimer Objstream

Setzen Sie objstream = server.createObject (adodb.stream)

objstream.type = 1

objstream.mode = 3

objstream.open

objstream.write Body

objstream.position = 0

objstream.type = 2

objstream.charset = cset

ByTestObstr = objstream.readText

objstream.close

objstream einstellen = nichts

Endfunktion

Aufrufmethode: BytestObstr (zu konvertierte Daten, Codierung) 'Codierung wird üblicherweise als GB2312 und UTF-8 verwendet

2. Extrahieren Sie alle Daten aus dem Erfassungscode

Die Methoden, die ich gemeistert habe, sind:

1. Verwenden Sie die integrierte Mid-Funktion von ASP, um die erforderlichen Daten abzufangen

Der folgende Inhalt ist der Programmcode:

Funktionskörper (WSTR, Start, Over)

Start = Newsstring (WSTR, Start)

'Setzen Sie die eindeutige Startmarke für die zu verarbeitenden Daten

Over = Newsstring (WSTR, Over)

'Der entsprechende Start ist das einzige Endzeichen der zu verarbeitenden Daten

Body = Mid (WSTR, Start, Überstart)

'Setzen Sie den Umfang der angezeigten Seite

Endfunktion

Anrufmethode: Körper (der Inhalt der gesammelten Seite, Start Marke, End Mark)

2. Verwenden Sie die Regelmäßigkeit, um die erforderlichen Daten zu erhalten

Der folgende Inhalt ist der Programmcode:

Funktionskörper (WSTR, Start, Over)

Setzen Sie xiaoqi = new Regexp'set -Konfigurationsobjekt

xiaoqi.ignorecase = true 'ignorieren Sie den Fall

xiaoqi.global = true 'set als Volltext -Suche

xiaoqi.pattern = & start &. ? & über & 'regulärer Ausdruck

Setzen Sie Matches = xiaoqi.execute (WSTR) 'Starten Sie die Konfigurationsausführung

Setzen Sie Xiaoqi = nichts

Körper =

Für jedes Spiel in Spielen

Body = Body & Match.Value 'Loop Match

Endfunktion

Anrufmethode: Körper (der Inhalt der gesammelten Seite, Start Marke, End Mark)

Sammeln von Verfahren und detaillierten Ideen:

1. Ermitteln Sie die Adresse jeder Seite der Seite der Paging -Liste der Website der Website

Derzeit haben die meisten dynamischen Websites Regeln für Paging -Adressen, z. B.:

Dynamische Seite

Seite 1: Index.asp? Seite = 1

Seite 2: Index.asp? Seite = 2

Seite 3: Index.asp? Seite = 3

.....

Statische Seite

Seite 1: page_1.htm

Seite 2: Page_2.htm

Seite 3: Page_3.htm

.....

Holen Sie sich die Adresse jeder Seite der Seite auf der Paging -Liste der Website. Sie müssen nur die Zeichen ersetzen, die die Adresse jeder Seite durch Variablen ändern, z. B.: Seite _ <%= & Page &%>. HTM

2. Ermitteln Sie den Inhalt der Seite der Seite der gesammelten Website

3. Extrahieren Sie die URL -Verbindungsadresse der gesammelten Inhaltsseite aus dem Paging -List -Code

Es gibt auch feste Regeln für die Verbindung von Inhaltsseiten auf den meisten Paging -Seiten, wie z. B.:

Verbinden 1

Anschließen 2

Verbindung 3

Verwenden Sie den folgenden Code, um eine URL -Verbindungssammlung zu erhalten

Der folgende Inhalt ist der Programmcode:

Das Folgende ist der zitierte Inhalt:

Setzen Sie xiaoqi = new regexp

xiaoqi.ignorecase = true

xiaoqi.global = true

xiaoqi.pattern =. ?

Setzen Sie Matches = xiaoqi.execute (Seitenlisteninhalt)

Setzen Sie Xiaoqi = nichts

URL =

Für jedes Spiel in Spielen

URL = URL & Match.Value

Da es sich um eine dynamisch generierte Seite handelt, haben die meisten Inhaltsseiten die gleichen HTML -Tags und wir können den Inhalt jedes Teils des erforderlichen Inhalts basierend auf diesen regulären Tags extrahieren.

wie:

Jede Seite hat einen Webseitenentitel. Sie können die Werte zwischen ihnen durch die oben geschriebene mittlere Abfangfunktion erhalten, oder Sie können sie mit regulären Ausdrücken erhalten.

Beispiel: Körper (,)

Teilen: So verwenden Sie ASP, um Ihre eigenen XML -Dateien zu lesen und zu schreiben Methoden
Zuvor habe ich zwei Beiträge über ASP geschrieben, die XML kombinieren, die Technologien zum Ersetzen von Datenbanken durch XML und die Integration von Datenbanken in XML vorstellten, so dass Datenbanken in einigen Fällen nicht mehr unsere einzige Wahl sind. Im Vergleich zu herkömmlichen Datenbanken hat XML die folgenden Vorteile