Direkomendasikan: ASP dan tautan akses Artikel ini menggambarkan dua cara menghubungkan ASP dan akses dalam contoh ASP. Berikut ini adalah konten yang direferensikan: %redup dd, connstrdd = data.mdbconnstr = & q
Langkah -langkah utama dari prosedur pengumpulan adalah sebagai berikut:
1. Dapatkan konten halaman yang dikumpulkan
2. Ekstrak semua data yang digunakan dari kode akuisisi
1. Dapatkan konten halaman yang dikumpulkan
Saat ini saya tahu metode yang umum digunakan untuk mendapatkan halaman yang dikumpulkan di ASP:
1. Gunakan komponen serverxmlhttp untuk mendapatkan data
Konten berikut adalah kode program:
| Berikut ini adalah konten yang dikutip: Fungsi getbody (weburl) 'Buat objek Redup objxmlhttp Setel objxmlhttp = server.CreateObject (msxml2.serverxmlhttp) 'Meminta file, dalam bentuk asinkron Objxmlhttp.open get, webuurl, false Objxmlhttp.send Sedangkan objxmlhttp.readystate <> 4 Objxmlhttp.waitforResponse 1000 Pergi ke 'Dapatkan hasilnya Getbody = objxmlhttp.responseBody 'Lepaskan objek Setel objxmlhttp = tidak ada Fungsi akhir |
Metode Panggilan:
Getbody (alamat URLF file)
2. Atau komponen xmlhttp untuk mendapatkan data
Konten berikut adalah kode program:
| Berikut ini adalah konten yang dikutip: Fungsi getbody (weburl) 'Buat objek Set Retrieval = CreateObject (Microsoft.xmlhttp) Dengan pengambilan .Open dapatkan, weburl, false ,, .Mengirim Getbody = .responseBody Berakhir dengan 'Lepaskan objek Atur retrieval = tidak ada Fungsi akhir |
Metode Panggilan:
Getbody (alamat URLF file)
Data yang diperoleh dengan cara ini juga perlu dikodekan dan dikonversi sebelum dapat digunakan
Konten berikut adalah kode program:
| Berikut ini adalah konten yang dikutip: Fungsi bytestoBstr (body, cset) redup objstream Set ObjStream = Server.CreateObject (adodb.stream) objstream.type = 1 objstream.mode = 3 objstream.open Objstream.write Body objstream.position = 0 objstream.type = 2 objstream.charset = cset BytestoBstr = objstream.readtext objstream.close atur objstream = tidak ada Fungsi akhir |
Metode panggilan: bytestoBstr (data yang akan dikonversi, pengkodean) 'Pengkodean umumnya digunakan sebagai GB2312 dan UTF-8
2. Ekstrak semua data yang digunakan dari kode akuisisi
Metode yang saya kuasai adalah:
1. Gunakan fungsi mid built-in ASP untuk mencegat data yang diperlukan
Konten berikut adalah kode program:
Badan fungsi (WSTR, MULAI, OVER)
start = newstring (wstr, start)
'Tetapkan tanda start yang unik untuk data yang akan diproses
over = newstring (wstr, over)
'Awal yang sesuai adalah satu -satunya tanda akhir dari data yang akan diproses
body = mid (wstr, start, overtart)
'Atur ruang lingkup halaman yang ditampilkan
Fungsi akhir
Metode Panggilan: Tubuh (Konten Halaman yang Dikumpulkan, Mulai Tanda, Tanda Akhir)
2. Gunakan keteraturan untuk mendapatkan data yang diperlukan
Konten berikut adalah kode program:
Badan fungsi (WSTR, MULAI, OVER)
Atur xiaoqi = objek konfigurasi regexp'set baru
xiaoqi.ignorecase = kasus abaikan 'true'
xiaoqi.global = true 'Set sebagai pencarian teks lengkap
xiaoqi.pattern = & mulai &. ? & over & 'ekspresi reguler
Set Cocches = XiaoQi.Execute (WSTR) 'Mulai Eksekusi Konfigurasi
atur xiaoqi = tidak ada
tubuh =
Untuk setiap pertandingan dalam pertandingan
body = body & match.value 'Loop Match
Berikutnya
Fungsi akhir
Metode Panggilan: Tubuh (Konten Halaman yang Dikumpulkan, Mulai Tanda, Tanda Akhir)
Mengumpulkan prosedur dan ide terperinci:
1. Dapatkan alamat setiap halaman halaman halaman Paging List Situs Web
Saat ini, sebagian besar situs web dinamis memiliki aturan untuk alamat paging, seperti:
Halaman dinamis
Halaman 1: index.asp? Halaman = 1
Halaman 2: index.asp? Halaman = 2
Halaman 3: index.asp? Halaman = 3
.....
Halaman statis
Halaman 1: page_1.htm
Halaman 2: page_2.htm
Halaman 3: page_3.htm
.....
Dapatkan alamat setiap halaman halaman halaman Paging List situs web, Anda hanya perlu mengganti karakter yang mengubah alamat setiap halaman dengan variabel, seperti: halaman _ <%= & page &%>. HTM
2. Dapatkan konten halaman halaman dari situs web yang dikumpulkan
3. Ekstrak alamat koneksi URL dari halaman konten yang dikumpulkan dari kode daftar paging
Ada juga aturan tetap untuk menghubungkan halaman konten di sebagian besar halaman paging, seperti:
Hubungkan 1
Hubungkan 2
Koneksi 3
Gunakan kode berikut untuk mendapatkan koleksi koneksi URL
Konten berikut adalah kode program:
| Berikut ini adalah konten yang dikutip: Atur xiaoqi = regexp baru xiaoqi.ignorecase = true xiaoqi.global = true xiaoqi.pattern =. ? Setel kecocokan = xiaoqi.execute (konten daftar halaman) atur xiaoqi = tidak ada url = Untuk setiap pertandingan dalam pertandingan url = url & match.value Berikutnya |
4. Dapatkan konten dari halaman konten yang dikumpulkan dan mencegat data yang akan diperoleh dari halaman konten yang dikumpulkan sesuai dengan tanda ekstraksi.
Karena ini adalah halaman yang dihasilkan secara dinamis, sebagian besar halaman konten memiliki tag HTML yang sama, dan kami dapat mengekstrak konten setiap bagian dari konten yang diperlukan berdasarkan tag reguler ini.
menyukai:
Setiap halaman memiliki judul halaman web. Anda bisa mendapatkan nilai di antara mereka dengan menggunakan fungsi Mid Intercept yang saya tulis di atas, atau Anda bisa mendapatkannya dengan ekspresi reguler.
Contoh: Tubuh (,)
Bagikan: Cara menggunakan ASP untuk menyesuaikan metode membaca file XML Anda sendiri Sebelum ini, saya menulis dua posting tentang ASP yang menggabungkan XML, memperkenalkan teknologi mengganti database dengan XML dan mengintegrasikan database dengan XML, sehingga database bukan lagi pilihan kami dalam beberapa kasus. Dibandingkan dengan database tradisional, XML memiliki keunggulan berikut