Program Akuisisi Web? Perayap web? Program Xiaolun? Apa pun yang Anda sebut, program semacam ini cukup banyak digunakan. Artikel ini tidak membahas masalah hak cipta atau moral yang disebabkan oleh penggunaan program ini, tetapi hanya membahas implementasi program ini di lingkungan ASP+VBScript :-)
Pengetahuan Persiapan: Selain pengetahuan ASP+VBScript umum, Anda juga perlu memahami objek XMLHTTP dan objek ekspresi reguler. Objek XMLHTTP adalah protagonis Ajax, yang saat ini berada di pusat perhatian; Dan setelah belajar ekspresi reguler, Anda tidak perlu lagi khawatir tentang berurusan dengan string yang kompleks.
Gadget Regex sangat berguna saat menulis dan men -debug ekspresi reguler.
Daftar isi
Merangkak halaman web jarak jauh dan menyimpannya secara lokal
Peningkatan: Tangani kode kacau
Unduh gambar (dan file lain) dari halaman web jarak jauh secara bersamaan
Ditingkatkan: mendeteksi URL nyata
Peningkatan: Hindari unduhan berulang
Contoh praktis (mengambil **** sebagai contoh)
Halaman Daftar Analisis
Tips Halaman Konten
Analisis halaman sebelumnya, halaman berikutnya di halaman konten
Topik Lanjutan: Konversi UTF-8 dan GB2312
Topik yang lebih canggih: Merayap setelah login, pemalsuan klien
Prosedur pengumpulan yang Anda miliki
Tautan asli: http://gwx.showus.net/blog/article.asp?id=229
1. Merayap halaman web jarak jauh dan menyimpannya ke lokal
'Untuk debugging, hasil perantara akan diperiksa beberapa kali kemudian
Dimindebug: indebug = true
Subd (str)
Ifindebug = falsethenexitsub
Response.write ("<divstyle = 'color:#003399; Border: solid1px#003399; latar belakang:#eef7ff; margin: 1px; ukuran font: 12px; padding: 4px;'>")
Response.write (str & "</div>")
Response.flush ()
Endsub
'Proses: Save2File
'Fungsi: Simpan Teks atau Byte Stream sebagai file
'Parameter: Istirahat untuk Menghemat Konten
'Sfile disimpan ke file, seperti "file/abc.htm"
'Adalah btext teks atau tidak
'Menulis apakah itu menimpa file yang ada
Subsave2file (scontent, sfile, btext, boverwrite)
Calld ("save2file:"+sfile+"*apakah teks:" & btext)
DimsaveOption, TypeOption
If (boverwrite = true) thensiveOption = 2elseSaveOption = 1
If (btext = true) thentypeOption = 2elsetypeOption = 1
Setads = server.createObject ("adodb.stream")
Withads
.Type = TypeOption
.Membuka
If (btext = true) then.writetextScontentelse.writeScontent