โปรแกรมซื้อเว็บ? Web Crawler? โปรแกรม Xiaolun? ไม่ว่าคุณจะเรียกมันว่าอะไรโปรแกรมประเภทนี้ค่อนข้างใช้กันอย่างแพร่หลาย บทความนี้ไม่ได้กล่าวถึงปัญหาลิขสิทธิ์หรือศีลธรรมที่เกิดจากการใช้โปรแกรมนี้ แต่จะกล่าวถึงการดำเนินการตามโปรแกรมนี้ในสภาพแวดล้อม ASP+VBScript :-)
ความรู้ในการเตรียมการ: นอกเหนือจากความรู้ทั่วไป ASP+VBScript คุณต้องเข้าใจวัตถุ XMLHTTP และวัตถุนิพจน์ทั่วไป วัตถุ XMLHTTP เป็นตัวเอกของ Ajax ซึ่งปัจจุบันอยู่ในไฟแก็ซ และหลังจากเรียนรู้การแสดงออกอย่างสม่ำเสมอคุณไม่ต้องกังวลเกี่ยวกับการจัดการกับสตริงที่ซับซ้อนอีกต่อไป
แกดเจ็ต Regex มีประโยชน์มากเมื่อเขียนและดีบักการแสดงออกปกติ
สารบัญ
คลานหน้าเว็บระยะไกลและบันทึกไว้ในพื้นที่
การปรับปรุง: จัดการรหัสที่อ่านไม่ออก
ดาวน์โหลดรูปภาพ (และไฟล์อื่น ๆ ) ของเว็บเพจระยะไกลในเวลาเดียวกัน
ปรับปรุง: การตรวจหา URL จริง
การปรับปรุง: หลีกเลี่ยงการดาวน์โหลดซ้ำ ๆ
ตัวอย่างที่เป็นประโยชน์ (ตัวอย่าง **** เป็นตัวอย่าง)
หน้ารายการวิเคราะห์
เคล็ดลับหน้าเนื้อหา
วิเคราะห์หน้าก่อนหน้าหน้าถัดไปในหน้าเนื้อหา
หัวข้อขั้นสูง: การแปลง UTF-8 และ GB2312
หัวข้อขั้นสูงเพิ่มเติม: การคลานหลังจากเข้าสู่ระบบการปลอมแปลงลูกค้า
ขั้นตอนการรวบรวมที่คุณมี
ลิงค์ดั้งเดิม: http://gwx.showus.net/blog/article.asp?id=229
1. คลานหน้าเว็บระยะไกลและบันทึกลงในท้องถิ่น
'สำหรับการดีบักผลลัพธ์ระดับกลางจะถูกตรวจสอบหลายครั้งในภายหลัง
dimindebug: indeBug = true
subd (str)
ifindebug = falsethenexitsub
Response.write ("<divstyle = 'สี:#003399; Border: Solid1px#003399; พื้นหลัง:#eef7ff; มาร์จิ้น: 1px; ตัวอักษรขนาด: 12px;
Response.write (str & "</div>")
Response.flush ()
enddub
กระบวนการ: save2file
'ฟังก์ชั่น: บันทึกข้อความหรือไบต์สตรีมเป็นไฟล์
'พารามิเตอร์: Scontent เพื่อบันทึกเนื้อหา
'Sfile ถูกบันทึกไว้ในไฟล์เช่น "ไฟล์/abc.htm"
'คือ btext เป็นข้อความหรือไม่
'เขียนมันเขียนทับไฟล์ที่มีอยู่
Subsave2File (Scontent, Sfile, Btext, Boverwrite)
calld ("save2file:"+sfile+"*ไม่ว่าจะเป็นข้อความ:" & btext)
Dimsaveoption, typeoption
if (boverwrite = true) thensaveoption = 2ElsesaveOption = 1
if (btext = true) thentypeOption = 2ElsetypeOption = 1
setads = server.createObject ("adodb.stream")
ด้วย
.type = typeOption
.เปิด
if (btext