Baru -baru ini sangat populer sehingga saya tidak suka mengumpulkan, tetapi saya sangat tertarik untuk meneliti prinsip -prinsip pengumpulan. Saya mendapat fungsi umum untuk koleksi online, mempelajarinya, dan mempraktikkannya dalam praktik. Hasilnya berhasil. Mengesampingkan masalah efisiensi, prinsip pengumpulan tidak rumit. Anda dapat memasukkan "Akuisisi" di bilah pencarian untuk melihat prinsip -prinsipnya. Berikut adalah contoh koleksi:
Salinan kode adalah sebagai berikut:
<%@Language = "vbscript" codepage = "65001"%>
<%Response.codepage = 65001%>
<%Response.charset = "UTF-8"%>
<%Server.scriptTimeout = 99999999
response.expires = 0
Response.ExpiresAbsolute = Now ()-1
response.addheader "pragma", "no-cache"
response.addheader "cache-control", "pribadi"
Response.cachecontrol = "no-cache"
%>
<%
'Deklarasikan fungsi untuk mendapatkan informasi target dan mengimplementasikannya melalui komponen XML.
FunctionGetUrl (url)
SetRetrieval = server.CreateObject ("msxml2.xmlhttp")
Tanpa retrieval
.Open "get", url, false
.Mengirim
If.status <> 200then 'menentukan apakah dokumen telah diuraikan untuk membuat klien menerima pesan pengembalian
fungsi keluar
Endif
'Biner to String
GetUrl = stb (.responseBody)
endwith
'Verifikasi informasi yang diperoleh. Jika panjang informasi kurang dari 100, itu berarti intersepsi gagal
Fungsi endfungsi
'Turn Binary ke String, jika tidak kacau akan muncul!
FunctionStB (VIN)
Constadtypetext = 2
DimbyTessTream, StringReturn
SetByTessTream = server.CreateObject ("adodb.stream")
WithByTessTream
.Type = adtypetext
.Membuka
.Writetextvin
.Posisi = 0
.Charset = "GB2312"
.Posisi = 2
StringReturn = .readtext
.Menutup
Endwith
SetByTessTream = tidak ada
STB = StringReturn
Fungsi endfungsi
FunctionNewString (WSTR, STRNG)
Newsstring = instr (lcase (wstr), lcase (strng))
IfNewString <= 0ThennewString = len (WSTR)
Fungsi endfungsi
'Deklarasikan format yang dicegat, mulai dari awal dan akhir dari lebih dari itu
FunctionGetKey (html, start, over)
Start = newstring (html, start)
Over = newstring (html, over)
GetKey = mid (html, start, overtart)
Fungsi endfungsi
Dimsoftid, url, html, judul
'Koleksi Baidu tahu
Fori = 1to100
Url = "http://zhidao.baidu.com/question/10000" & i & ".html"
Html = getUrl (url)
Pertanyaan = getKey (html, "<cq>", "</cq>")
Jawaban = getKey (html, "<ca>", "</a>")
Response.write (pertanyaan & "<br/>")