Kami biasanya menggunakan data eksternal merangkak di dua tempat, satu di ASP dan yang lainnya di HTA. Jika data eksternal dikodekan oleh GB2312, itu melibatkan masalah transcoding. Namun, metode tradisional menggunakan fungsi VBS memiliki komputasi yang relatif besar, dan beberapa karakter khusus bahkan dapat membuat kesalahan.
Jika Anda menggunakan ADODB.Stream Control ke Transcode, itu akan jauh lebih sederhana dan Anda tidak perlu menggunakan fungsi pemrosesan biner dari VBS, dan kecepatannya jauh lebih cepat.
Salinan kode adalah sebagai berikut:
<script>
functionLoadData (surl) {
varxh
xh = newActivexObject ("microsoft.xmlhttp")
xh.open ("get", surl, false)
xh.send (null)
returnb2utf8 (xh.responseBody)
}
functionGB2Utf8 (sdata) {
varostream
ostream = newActivexObject ("adodb"+". stream")
ostream.type = 1
ostream.mode = 3
ostream.open
ostream.write (sdata)
ostream.position = 0
ostream.type = 2
ostream.charset = "GB2312"
returnStream.readtext ()
}
</script>
Artikel yang mungkin menarik bagi Anda:
Zero-Based Java Zhihu Crawler: Store the crawled content to the local Zero-Based Java Zhihu Crawler: Crawling Zhihu Answers Java Crawler Mouse Events and Mouse Scrolling Events Example Java Crawling Based on URLs and generate thumbnails java Crawling 12306 Information Implementation Train Remaining Query Example Java Crawling Web Page Data Example Java Crawling Web Page Content Kode Implementasi Java merangkak data halaman web mendapatkan semua tautan instance di halaman web berbagi alamat email java merangkak di halaman web