Empfohlen: ASP und Zugriffslink Dieser Artikel zeigt zwei Möglichkeiten zur Verknüpfung von ASP und Zugriff in ASP -Beispielen. Im Folgenden ist der in Bezug
Die Hauptschritte des Sammelverfahrens sind wie folgt:
1. Ermitteln Sie den Inhalt der gesammelten Seite
2. Extrahieren Sie alle Daten aus dem Erfassungscode
1. Ermitteln Sie den Inhalt der gesammelten Seite
Ich kenne derzeit die häufig verwendeten Methoden, um gesammelte Seiten in ASP zu erhalten:
1. Verwenden Sie die ServerxmlHTTP -Komponente, um Daten zu erhalten
Der folgende Inhalt ist der Programmcode:
| Das Folgende ist der zitierte Inhalt: Funktion Getbody (Weburl) 'Erstellen Sie ein Objekt Dimer objxmlhttp Setzen Sie objxmlhttp = server.createObject (msxml2.ServerxMlhttp) 'Anfragedatei in asynchroner Form anfordern Objxmlhttp.open GET, Webuurl, Falsch Objxmlhttp.send Während objxmlhttp.readystate <> 4 Objxmlhttp.waitforresponse 1000 Wend 'Holen Sie sich das Ergebnis GetBody = objxmlhttp.ResponseBody 'Lust das Objekt Setzen Sie objxmlhttp = nichts Endfunktion |
Aufrufmethode:
Getbody (die URLF -Adresse der Datei)
2. oder XMLHTTP -Komponente, um Daten zu erhalten
Der folgende Inhalt ist der Programmcode:
| Das Folgende ist der zitierte Inhalt: Funktion Getbody (Weburl) 'Erstellen Sie ein Objekt Set Retrieval = createObject (microsoft.xmlhttp) Mit Abruf .Open bekommen, weburl, falsch,, .Schicken Getbody = .ResponseBody Enden mit 'Lust das Objekt Retrieval einstellen = nichts Endfunktion |
Aufrufmethode:
Getbody (die URLF -Adresse der Datei)
Die auf diese Weise erhaltenen Daten müssen auch codiert und konvertiert werden, bevor sie verwendet werden können
Der folgende Inhalt ist der Programmcode:
| Das Folgende ist der zitierte Inhalt: Funktion byTestObstr (Körper, cset) Dimer Objstream Setzen Sie objstream = server.createObject (adodb.stream) objstream.type = 1 objstream.mode = 3 objstream.open objstream.write Body objstream.position = 0 objstream.type = 2 objstream.charset = cset ByTestObstr = objstream.readText objstream.close objstream einstellen = nichts Endfunktion |
Aufrufmethode: BytestObstr (zu konvertierte Daten, Codierung) 'Codierung wird üblicherweise als GB2312 und UTF-8 verwendet
2. Extrahieren Sie alle Daten aus dem Erfassungscode
Die Methoden, die ich gemeistert habe, sind:
1. Verwenden Sie die integrierte Mid-Funktion von ASP, um die erforderlichen Daten abzufangen
Der folgende Inhalt ist der Programmcode:
Funktionskörper (WSTR, Start, Over)
Start = Newsstring (WSTR, Start)
'Setzen Sie die eindeutige Startmarke für die zu verarbeitenden Daten
Over = Newsstring (WSTR, Over)
'Der entsprechende Start ist das einzige Endzeichen der zu verarbeitenden Daten
Body = Mid (WSTR, Start, Überstart)
'Setzen Sie den Umfang der angezeigten Seite
Endfunktion
Anrufmethode: Körper (der Inhalt der gesammelten Seite, Start Marke, End Mark)
2. Verwenden Sie die Regelmäßigkeit, um die erforderlichen Daten zu erhalten
Der folgende Inhalt ist der Programmcode:
Funktionskörper (WSTR, Start, Over)
Setzen Sie xiaoqi = new Regexp'set -Konfigurationsobjekt
xiaoqi.ignorecase = true 'ignorieren Sie den Fall
xiaoqi.global = true 'set als Volltext -Suche
xiaoqi.pattern = & start &. ? & über & 'regulärer Ausdruck
Setzen Sie Matches = xiaoqi.execute (WSTR) 'Starten Sie die Konfigurationsausführung
Setzen Sie Xiaoqi = nichts
Körper =
Für jedes Spiel in Spielen
Body = Body & Match.Value 'Loop Match
Nächste
Endfunktion
Anrufmethode: Körper (der Inhalt der gesammelten Seite, Start Marke, End Mark)
Sammeln von Verfahren und detaillierten Ideen:
1. Ermitteln Sie die Adresse jeder Seite der Seite der Paging -Liste der Website der Website
Derzeit haben die meisten dynamischen Websites Regeln für Paging -Adressen, z. B.:
Dynamische Seite
Seite 1: Index.asp? Seite = 1
Seite 2: Index.asp? Seite = 2
Seite 3: Index.asp? Seite = 3
.....
Statische Seite
Seite 1: page_1.htm
Seite 2: Page_2.htm
Seite 3: Page_3.htm
.....
Holen Sie sich die Adresse jeder Seite der Seite auf der Paging -Liste der Website. Sie müssen nur die Zeichen ersetzen, die die Adresse jeder Seite durch Variablen ändern, z. B.: Seite _ <%= & Page &%>. HTM
2. Ermitteln Sie den Inhalt der Seite der Seite der gesammelten Website
3. Extrahieren Sie die URL -Verbindungsadresse der gesammelten Inhaltsseite aus dem Paging -List -Code
Es gibt auch feste Regeln für die Verbindung von Inhaltsseiten auf den meisten Paging -Seiten, wie z. B.:
Verbinden 1
Anschließen 2
Verbindung 3
Verwenden Sie den folgenden Code, um eine URL -Verbindungssammlung zu erhalten
Der folgende Inhalt ist der Programmcode:
| Das Folgende ist der zitierte Inhalt: Setzen Sie xiaoqi = new regexp xiaoqi.ignorecase = true xiaoqi.global = true xiaoqi.pattern =. ? Setzen Sie Matches = xiaoqi.execute (Seitenlisteninhalt) Setzen Sie Xiaoqi = nichts URL = Für jedes Spiel in Spielen URL = URL & Match.Value Nächste |
V.
Da es sich um eine dynamisch generierte Seite handelt, haben die meisten Inhaltsseiten die gleichen HTML -Tags und wir können den Inhalt jedes Teils des erforderlichen Inhalts basierend auf diesen regulären Tags extrahieren.
wie:
Jede Seite hat einen Webseitenentitel. Sie können die Werte zwischen ihnen durch die oben geschriebene mittlere Abfangfunktion erhalten, oder Sie können sie mit regulären Ausdrücken erhalten.
Beispiel: Körper (,)
Teilen: So verwenden Sie ASP, um Ihre eigenen XML -Dateien zu lesen und zu schreiben Methoden Zuvor habe ich zwei Beiträge über ASP geschrieben, die XML kombinieren, die Technologien zum Ersetzen von Datenbanken durch XML und die Integration von Datenbanken in XML vorstellten, so dass Datenbanken in einigen Fällen nicht mehr unsere einzige Wahl sind. Im Vergleich zu herkömmlichen Datenbanken hat XML die folgenden Vorteile