Ingin memiliki mesin pencari Anda sendiri? Menggunakan metode akuisisi data yang saat ini populer, Anda dapat segera memilikinya. Berikut ini adalah mengajar Anda untuk mengimplementasikannya langkah demi langkah.
1. Memahami pencarian Baidu
Baidu Search, mesin pencari Cina terbesar di dunia, terdaftar di NASDAQ di Amerika Serikat pada 5 Agustus 2005. Saat ini mesin pencari dengan tingkat penggunaan pengguna tertinggi di Cina, menyediakan berbagai pencarian seperti halaman web, berita, gambar, musik, peta, dll.
1. Parameter kueri untuk pencarian web Baidu
Parameter yang diperlukan
☆ WD-kata kunci untuk kueri (kata kunci)
☆ PN-jumlah halaman yang menunjukkan hasilnya (nomor pagen)
☆ CL-Tipe Penelitian (kelas), Cl = 3 adalah pencarian web
Parameter opsional
☆ RN-Jumlah hasil pencarian (RecordNumber), rentang nilai antara 10-100, pengaturan default adalah RN = 10
☆ IE-Query Pengkodean teks input (inputencoding), pengaturan default adalah IE = GB2312, yang disederhanakan Cina
☆ TN-Situs sumber untuk mengirimkan permintaan pencarian
Beberapa TN yang berguna
TN = Baidulocal berarti bahwa pencarian di situs Baidu, hasil yang dikembalikan sangat bersih dan tidak ada gangguan iklan. Misalnya, cari "bahagia" di Baidu untuk melihat apakah hasil pengembalian menyegarkan.
TN = Baiducnnic ingin menempatkan Baidu dalam kerangka itu? Coba saja parameter ini, itu disesuaikan oleh Baidu untuk CNNIC
☆ Penelusuran dalam Nama Domain Terbatas. Misalnya, jika Anda ingin mencari di situs web Sina, Anda dapat menggunakan parameter si = sina.com.cn. Untuk membuat parameter ini efektif, Anda harus menggunakannya bersama dengan parameter CT.
☆ CT-Nilai parameter ini umumnya merupakan string angka, yang diperkirakan menjadi kode verifikasi untuk permintaan pencarian.
Gunakan parameter SI dan CT dalam kombinasi, misalnya, mencari "ideal" di Sina.com.cn, tersedia: http://www.baidu.com/baidu?ie=utf-8&am...n&cl=3&word=ideal
☆ BS-Kata kunci dari pencarian terakhir (beforesearch), yang diperkirakan terkait dengan pencarian terkait.
2. Struktur Halaman Hasil Pencarian Baidu
Menurut struktur kode sumber, top-down adalah:
Kotak pencarian
Memperbaiki peringkat area panas di sebelah kanan
Hasil pencarian
Area pagination
Pencarian terkait
Kotak pencarian bawah
Area Hak Cipta
Di antara mereka, dua bagian "hasil pencarian dan area paging" adalah data yang valid yang kita butuhkan. Menurut hasil kode, Anda dapat menemukan pengidentifikasi string uniknya. Cukup mencegat konten melalui pengidentifikasi ini. Untuk detailnya, lihat kode berikut.
2. Fungsi inti-komponen xmlhttp menggunakan ASP
Program pengumpulan data, umumnya dikenal sebagai Program Pencuri, adalah bagian inti dari komponen XMLHTTP ini. Agak kuno menggunakan XMLHTTP untuk mengumpulkan data, dan ada juga banyak informasi online. Umumnya, kode koleksi adalah
setthttp = server.CreateObject ("msxml2.xmlhttp")
Http.open "get", url, false'open xmlhttp
Http.send () 'Kirim permintaan
ifhttp.readystate <> 4then
fungsi keluar
endif
getHttppage = bytestoBstr (http.responseBody, "gb2312") 'mengembalikan hasilnya (biasanya aliran byte) dan mengubah aliran byte menjadi string
setthttp = nothing'release xmlhttp
Lihat kode lengkap di bawah ini untuk aplikasi terperinci
3. Kode Lengkap (Nama File: Searchi_Bd.asp)
<%
OptionExplicit
Dimwd, pn
wd = request ("wd")