Artikel ini memperkenalkan berbagi tutorial dari Batch merangkak halaman daftar. Mari kita lihat tutorial terperinci di bawah ini. Teman yang membutuhkannya bisa merujuknya.
Beberapa orang adalah harta karun saat merangkak, tetapi mereka masih menjualnya untuk TND. Memang benar bahwa orang -orang ini! Mungkin hal berikut agak buruk
Berikut ini tidak memiliki fungsi tulis-ke-toko, dan telah mencapai titik ini. Fungsi entri sangat sederhana. Harap selesaikan sendiri jika Anda membutuhkannya. Harap tingkatkan fungsi lain sendiri! Salin kode dan jalankan langsung untuk melihat efeknya
DIM URL, LIST_PAGECODE, ARRAY_ARTICLEID, I, ARTTERDID
Dim content_pagecode, content_tempcode
Dim content_categoryId, content_categoryname, borderid, classid, bordername, classname
Dim Articletitle, Articleauthor, Artikel dari, Articlecontent
Url = "http://www.webasp.net/article/class/1.htm"
List_pagecode = getHttppage (url)
List_pagecode = regexPtext (list_pagecode, "cetak", "
List_pagecode = regexPtext (list_pagecode, "'Dapatkan tautan artikel dari halaman daftar saat ini untuk memisahkannya
Array_articleid = split (list_pagecode, ",") 'Buat array dan simpan ID artikel
Untuk i = 0 ke ubound (array_articleid) -1
ArtictID = array_arrayid (i) 'arrayid
Content_pagecode = getHttppage ("http://www.webasp.net/article/" & artikel) 'Dapatkan konten halaman artikel
'==================================================
Content_tempcode = regexPtext (content_pagecode, "tutorial teknis >>", ">> konten", 0)
Content_categoryId = regexPtext (content_pagecode, "", 1)
BorderId = split (content_categoryid, ",") (0) 'ID kelas besar
Classid = split (content_categoryid, ",") (1) 'ID subclass
'============== Periksa apakah kategori utama ada. Mulai ==================
'Jika tidak ada, masukkan database
'=============== Periksa apakah kategori utama ada akhir ===================
'Response.write (borderid & "," & classid & "
")
Content_categoryName = RegExPtext (content_pagecode, "/'>", "", 1)
BorderName = split (content_categoryname, ",") (0) 'Nama kelas besar
ClassName = split (content_categoryname, ",") (1) 'nama subclass
'=============== Periksa apakah subclass ada mulai ==================
'Jika tidak ada, masukkan database
'=============== Periksa apakah subclass ada akhir ==================
'=====================================================
'==========================================================
Articletitle = regexPtext (content_pagecode, " ", " ", 0)
Articleauthor = RegExptext (content_pagecode, "penulis:", "", 0)
ArtikelFrom = regexPtext (content_pagecode, "sumber:", "", 0)
ArticLecontent = RegExPtext (content_pagecode, "", "" & vbcrlf & "" & vbcrlf & "", 0)
'============================================================
Response.write (Articletitle & "
")
Response.flush ()
Berikutnya
Beberapa fungsi dilampirkan:
Function getHttppage (URL)If (isobjinstalled ("microsoft.xmlhttp") = false) kemudian
Respons.write "
Server tidak mendukung komponen microsoft.xmlhttp "
Err.clear
Respons.end
Akhiri jika
Pada kesalahan resume berikutnya
Redup http
Setel http = server.CreateObject ("msxml2.xmlhttp")
Http.open "get", url, false
Http.send ()
If (http.readystate4) lalu
Fungsi keluar
Akhiri jika
getHttppage = bytestoBstr (http.responseBody, "GB2312")
Atur http = tidak ada
If (err.number0) lalu
Respons.write "
Terjadi kesalahan saat mendapatkan konten file "
'Response.end
Err.clear
Akhiri jika
Fungsi akhir
Fungsi bytestoBstr (codebody, codeset)
Redup objstream
Set ObjStream = Server.CreateObject ("AdodB.Stream")
objstream.type = 1
objstream.mode = 3
objstream.open
objstream.write codebody
objstream.position = 0
objstream.type = 2
objstream.charset = codeset
BytestoBstr = objstream.readtext
objstream.close
Atur objstream = tidak ada
Fungsi akhir
'====================================================================
'Fungsi: Periksa apakah komponen telah diinstal
'Nilai pengembalian: true ---- terpasang
'Salah --- tidak terpasang
'====================================================================
Fungsi isobjinstalled (objname)
Pada kesalahan resume berikutnya
Isobjinstalled = false
Err = 0
Redup testobj
Set TestObj = Server.CreateObject (objName)
If (0 = err) kemudian isobjinstalled = true
Atur testobj = tidak ada
Err = 0
Fungsi akhir
Fungsi regexptext (strng, strstart, strend, n)
Redup regex, pertandingan, pertandingan, retstr
Atur regex = regexp baru
Regex.pattern = strStart & "([/s/s]*?)" & Strend
Regex.ignorecase = true
regex.global = true
Set kecocokan = regex.execute (strng)
Untuk setiap pertandingan dalam pertandingan
If (n = 1) kemudian
Retstr = retstr & regex.replace (match.value, "$ 1") & ","
KALAU TIDAK
Retstr = retstr & regex.replace (match.value, "$ 1")
Akhiri jika
Berikutnya
RegExptext = Retstr
Atur regex = tidak ada
Di atas adalah pengenalan seluruh konten berbagi tutorial dari batch merangkak halaman daftar tertentu. Saya berharap pengetahuan dan materi yang relevan yang disusun oleh editor akan membantu Anda. Untuk konten lebih lanjut, silakan terus perhatikan situs web Wuxin Technology Channel!