通常、2つの場所でクロールする外部データを使用します。1つはASPに、もう1つはHTAに使用します。外部データがGB2312によってエンコードされている場合、トランスコーディングの問題が含まれます。ただし、VBS関数を使用する従来の方法には比較的大量の計算があり、一部の特殊文字はエラーを発生させることさえあります。
adodb.streamコントロールをトランスコードに使用すると、はるかに簡単になります。 VBSのバイナリ処理機能を使用する必要はなく、速度ははるかに高速です。
<スクリプト>
functionloaddata(surl){
varxh
xh = newactivexobject( "microsoft.xmlhttp")
xh.open( "get"、surl、false)
xh.send(null)
returnb2utf8(xh.responsebody)
}
functiongb2utf8(sdata){
バロストリーム
osttream = newactiveXobject( "adodb"+"。ストリーム")
osttream.type = 1
ostream.mode = 3
ostream.open
osttream.write(sdata)
osttream.position = 0
osttream.type = 2
osttream.charset = "gb2312"
returnStream.readText()
}
</script>
あなたに興味があるかもしれない記事:
ゼロベースのJava Zhihu Crawler:クロールされたコンテンツを地元のゼロベースのJava Zhihu Crawlerに保存:クローリングZhihuはJava Crawler Mouse EventsとMouse Scrolling Eventsの例です。実装コードJavaクローリングWebページデータWebページですべてのリンクインスタンスをWebページで共有するJava Crawlingメールアドレスを共有する