推奨:ASPおよびアクセスリンクこの記事では、ASPとASPの例でASPとアクセスをリンクする2つの方法を示しています。以下は参照されているコンテンツです:%dim dd、connstrdd = data.mdbconnstr =&q
収集手順の主な手順は次のとおりです。
1.収集されたページのコンテンツを取得します
2。取得コードから使用されるすべてのデータを抽出します
1.収集されたページのコンテンツを取得します
私は現在、ASPで収集されたページを取得する一般的に使用される方法を知っています。
1。ServerXmlhttpコンポーネントを使用してデータを取得します
次のコンテンツはプログラムコードです。
| 以下は引用されたコンテンツです。 関数getbody(weburl) 'オブジェクトを作成します dim objxmlhttp objxmlhttp = server.createobject(msxml2.serverxmlhttp)を設定します '非同期形式でファイルを要求します objxmlhttp.open get、webuurl、false objxmlhttp.send while objxmlhttp.ReadyState <> 4 objxmlhttp.waitforresponse 1000 ウェンド '結果を取得します getBody = objxmlhttp.responsebody 'オブジェクトをリリースします objxmlhttp =何も設定しません エンド関数 |
呼び出し方法:
GetBody(ファイルのURLFアドレス)
2。またはデータを取得するxmlhttpコンポーネント
次のコンテンツはプログラムコードです。
| 以下は引用されたコンテンツです。 関数getbody(weburl) 'オブジェクトを作成します set retireval = createObject(microsoft.xmlhttp) 検索付き .open get、weburl、false 、、 。送信 GetBody = .ResponseBody で終わります 'オブジェクトをリリースします set retireval = Nothing エンド関数 |
呼び出し方法:
GetBody(ファイルのURLFアドレス)
この方法で取得したデータは、使用する前にエンコードして変換する必要があります
次のコンテンツはプログラムコードです。
| 以下は引用されたコンテンツです。 関数bytestobstr(body、cset) DIM OBJSTREAM objstream = server.createobject(adodb.stream)を設定します objstream.type = 1 objstream.mode = 3 objstream.open objstream.write body objstream.position = 0 objstream.type = 2 objstream.charset = cset bytestobstr = objstream.readtext objstream.close objstream = Nothingを設定します エンド関数 |
通話方法:bytestobstr(変換するデータ、エンコード) 'エンコードは、一般的にGB2312およびUTF-8として使用されます
2。取得コードから使用されるすべてのデータを抽出します
私が習得した方法は次のとおりです。
1. ASPの組み込みの中間関数を使用して、必要なデータを傍受する
次のコンテンツはプログラムコードです。
関数ボディ(WSTR、スタート、オーバー)
start = newstring(wstr、start)
'処理するデータの一意のスタートマークを設定します
Over = NewString(WSTR、OVER)
「対応するスタートは、処理されるデータの唯一の終了マークです
body = mid(wstr、start、offer-start)
'表示されたページの範囲を設定します
エンド関数
通話方法:body(収集されたページのコンテンツ、スタートマーク、エンドマーク)
2。規則性を使用して、必要なデータを取得します
次のコンテンツはプログラムコードです。
関数ボディ(WSTR、スタート、オーバー)
xiaoqi = new regexp'set構成オブジェクトを設定します
xiaoqi.ignorecase = true 'ケースを無視します
xiaoqi.global = true 'フルテキスト検索として設定
xiaoqi.pattern =&start&。 ?&& '正規表現
一致= xiaoqi.execute(wstr) '設定実行を開始します
Xiaoqi = Nothingを設定します
ボディ=
試合の各試合について
body = body&match.value 'ループマッチ
次
エンド関数
通話方法:body(収集されたページのコンテンツ、スタートマーク、エンドマーク)
手順と詳細なアイデアの収集:
1.ウェブサイトのページングリストページのページの各ページのアドレスを取得する
現在、ほとんどの動的なWebサイトには、次のようなページングアドレスのルールがあります。
動的ページ
ページ1:index.asp?ページ= 1
ページ2:index.asp?ページ= 2
ページ3:index.asp?ページ= 3
.....
静的ページ
1ページ:Page_1.htm
ページ2:page_2.htm
ページ3:page_3.htm
.....
Webサイトのページリストページのページの各ページのアドレスを取得すると、各ページのアドレスを変更する文字を次のような変数に置き換える必要があります。
2。収集されたWebサイトのページのコンテンツを取得する
3.ページングリストコードから収集されたコンテンツページのURL接続アドレスを抽出します
また、以下など、ほとんどのページングページにコンテンツページを接続するための固定ルールもあります。
接続1
接続2
接続3
次のコードを使用して、URL接続コレクションを取得します
次のコンテンツはプログラムコードです。
| 以下は引用されたコンテンツです。 set xiaoqi = new regexp xiaoqi.ignorecase = true xiaoqi.global = true xiaoqi.pattern =。 ? 一致= xiaoqi.execute(ページリストコンテンツ)を設定する Xiaoqi = Nothingを設定します url = 試合の各試合について url = url&match.value 次 |
4.収集されたコンテンツページのコンテンツを取得し、抽出マークに従って収集されたコンテンツページから取得するデータを傍受します。
動的に生成されたページであるため、ほとんどのコンテンツページには同じHTMLタグがあり、これらの通常のタグに基づいて必要なコンテンツの各部分のコンテンツを抽出できます。
のように:
各ページにはWebページのタイトルがあります。上に書いた中間インターセプト関数を使用して、それらの間に値を取得するか、正規表現でそれらを取得することができます。
例:body(、)
共有:ASPを使用して独自のXMLファイルの読み書き方法をカスタマイズする方法この前に、XMLを組み合わせたASPに関する2つの投稿を書き、データベースをXMLに置き換え、データベースをXMLと統合する技術を紹介しました。これにより、データベースは場合によっては唯一の選択肢ではなくなりました。従来のデータベースと比較して、XMLには次の利点があります