ต้องการมีเครื่องมือค้นหาของคุณเองหรือไม่? การใช้วิธีการเก็บข้อมูลยอดนิยมในปัจจุบันคุณสามารถมีได้ทันที นี่คือการสอนให้คุณใช้มันทีละขั้นตอน
1. เข้าใจการค้นหา Baidu
Baidu Search ซึ่งเป็นเครื่องมือค้นหาจีนที่ใหญ่ที่สุดในโลกได้รับการจดทะเบียนใน NASDAQ ในสหรัฐอเมริกาเมื่อวันที่ 5 สิงหาคม 2548 ปัจจุบันเป็นเครื่องมือค้นหาที่มีอัตราการใช้งานผู้ใช้สูงสุดในประเทศจีน
1. พารามิเตอร์แบบสอบถามสำหรับการค้นหาเว็บ Baidu
พารามิเตอร์ที่ต้องการ
☆ WD-คีย์คำสำหรับการสืบค้น (คำหลัก)
☆ pn-จำนวนหน้าแสดงผลลัพธ์ (pagenumber)
☆ cl-ประเภทการค้นหา (คลาส), cl = 3 คือการค้นหาเว็บ
พารามิเตอร์เสริม
☆ rn-จำนวนผลการค้นหา (recordNumber) ช่วงค่าอยู่ระหว่าง 10-100 การตั้งค่าเริ่มต้นคือ rn = 10
☆ IE-การเข้ารหัสการเข้ารหัสข้อความอินพุต (การเข้ารหัส) การตั้งค่าเริ่มต้นคือ IE = GB2312 ซึ่งเป็นภาษาจีนที่ง่ายขึ้น
☆ tn-เว็บไซต์ต้นทางสำหรับส่งคำขอค้นหา
TNS ที่มีประโยชน์หลายประการ
TN = baidulocal หมายความว่าการค้นหาบนไซต์ Baidu ผลลัพธ์ที่ส่งคืนนั้นสะอาดมากและไม่มีสัญญาณรบกวนโฆษณา ตัวอย่างเช่นค้นหา "มีความสุข" บน Baidu เพื่อดูว่าผลการส่งคืนสดชื่นหรือไม่
tn = baiducnnic ต้องการที่จะใส่ baidu ในกรอบ? เพียงแค่ลองพารามิเตอร์นี้มันถูกปรับแต่งโดย Baidu สำหรับ CNNIC
☆ si-search ในชื่อโดเมนที่ จำกัด ตัวอย่างเช่นหากคุณต้องการค้นหาบนเว็บไซต์ของ Sina คุณสามารถใช้พารามิเตอร์ si = sina.com.cn เพื่อให้พารามิเตอร์นี้มีประสิทธิภาพคุณต้องใช้ร่วมกับพารามิเตอร์ CT
☆ CT-ค่าของพารามิเตอร์นี้โดยทั่วไปเป็นสตริงของตัวเลขซึ่งคาดว่าจะเป็นรหัสการตรวจสอบสำหรับคำขอค้นหา
ใช้พารามิเตอร์ SI และ CT ร่วมกันตัวอย่างเช่นการค้นหา "อุดมคติ" ใน sina.com.cn พร้อมใช้งาน: http://www.baidu.com/baidu?ie=utf-8&am...n&cl=3&word=ideal
☆ bs-คำสำคัญของการค้นหาล่าสุด (beforesearch) ซึ่งคาดว่าจะเกี่ยวข้องกับการค้นหาที่เกี่ยวข้อง
2. โครงสร้างหน้าผลการค้นหา Baidu
ตามโครงสร้างซอร์สโค้ด, บนลงล่างคือ:
ช่องค้นหา
แก้ไขการจัดอันดับพื้นที่ร้อนทางด้านขวา
ผลการค้นหา
พื้นที่ปนเปื้อน
การค้นหาที่เกี่ยวข้อง
กล่องค้นหาด้านล่าง
พื้นที่ลิขสิทธิ์
ในหมู่พวกเขาทั้งสองส่วน "ผลการค้นหาและพื้นที่เพจ" เป็นข้อมูลที่ถูกต้องที่เราต้องการ ตามผลลัพธ์ของรหัสคุณสามารถค้นหาตัวระบุสตริงที่ไม่ซ้ำกันได้ เพียงแค่สกัดกั้นเนื้อหาผ่านตัวระบุนี้ สำหรับรายละเอียดดูรหัสต่อไปนี้
2. ฟังก์ชั่นหลัก-องค์ประกอบ xmlhttp โดยใช้ ASP
โปรแกรมการรวบรวมข้อมูลที่รู้จักกันทั่วไปว่าเป็นโปรแกรมขโมยเป็นส่วนสำคัญขององค์ประกอบ XMLHTTT นี้ มันค่อนข้างล้าสมัยเล็กน้อยที่จะใช้ XMLHTTP เพื่อรวบรวมข้อมูลและยังมีข้อมูลออนไลน์มากมาย โดยทั่วไปรหัสคอลเลกชันคือ
setthttp = server.createObject ("msxml2.xmlhttp")))
http.open "get", url, false'open xmlhttp
http.send () 'ส่งคำขอ
ifhttp.readystate <> 4 จากนั้น
exitfunction
endif
gethttppage = bytestobstr (http.responsebody, "gb2312") 'ส่งคืนผลลัพธ์ (โดยปกติจะเป็นไบต์สตรีม) และแปลงสตรีมไบต์เป็นสตริง
setTHTTP = ไม่มีอะไร release xmlhttp
ดูรหัสที่สมบูรณ์ด้านล่างสำหรับแอปพลิเคชันโดยละเอียด
3. รหัสสมบูรณ์ (ชื่อไฟล์: searchi_bd.asp)
-
ตัวเลือก Explicit
dimwd, pn
WD = คำขอ ("WD")