Ada banyak cara untuk mencegah pengumpulan saat ini. Biarkan saya pertama kali memperkenalkan strategi anti-pengumpulan umum, kelemahan dan penanggulangan koleksi mereka:
1. Tentukan jumlah kunjungan ke halaman situs web ini dengan IP dalam periode waktu tertentu. Jika jelas melebihi kecepatan penelusuran normal, IP akan ditolak.
Kerugian:
1. Metode ini hanya berlaku untuk halaman dinamis, seperti: ASP/JSP/PHP, dll .... Halaman statis tidak dapat menentukan berapa kali IP tertentu mengunjungi halaman situs ini untuk jangka waktu tertentu.
2. Metode ini akan secara serius mempengaruhi dimasukkannya laba-laba mesin pencari, karena ketika dimasukkannya laba-laba mesin pencari, kecepatan penelusuran akan relatif cepat dan multi-threaded. Metode ini juga menolak file laba -laba mesin pencari yang termasuk dalam situs
Mengumpulkan strategi: Hanya memperlambat kecepatan pengumpulan, atau tidak
Saran: Buat perpustakaan IP Laba -laba Mesin Pencari, yang hanya memungkinkan laba -laba mesin pencari untuk dengan cepat menelusuri konten di situs. Tidak mudah untuk mengumpulkan perpustakaan IP laba -laba mesin pencari. Laba -laba mesin pencari tidak harus hanya memiliki satu alamat IP tetap.
Komentar: Metode ini lebih efektif untuk mencegah pengumpulan, tetapi akan memengaruhi inklusi mesin pencari.
2. Enkripsi halaman konten dengan javascript
Kerugian: Metode ini cocok untuk halaman statis, tetapi akan secara serius mempengaruhi dimasukkannya mesin pencari. Konten yang diterima oleh mesin pencari juga dienkripsi.
Mengumpulkan Penanggulangan: Disarankan untuk Tidak Memilih. Jika Anda harus memilih, Anda juga dapat memilih skrip JS yang mendekripsi kata sandi.
Saran: Saat ini tidak ada saran yang baik untuk perbaikan
Komentar: Disarankan agar webmaster yang mengharapkan mesin pencari membawa lalu lintas untuk tidak menggunakan metode ini.
3. Ganti tanda spesifik pada halaman konten dengan "tanda spesifik + teks hak cipta tersembunyi"
Kerugian: Metode ini memiliki sedikit kelemahan, itu hanya akan meningkatkan ukuran file halaman, tetapi mudah untuk membalikkan koleksi.
Mengumpulkan Strategi: Ganti teks berhak cipta yang dikumpulkan dengan konten teks hak cipta tersembunyi, atau gantilah dengan hak cipta Anda sendiri.
Saran: Saat ini tidak ada saran yang baik untuk perbaikan
Komentar: Saya merasa itu tidak terlalu praktis. Bahkan jika saya menambahkan kata -kata tersembunyi acak, itu setara dengan menambahkan lebih banyak.
4. Hanya mengizinkan pengguna untuk menelusuri setelah masuk
Kerugian: Metode ini akan secara serius mempengaruhi dimasukkannya laba -laba mesin pencari
Mengumpulkan Penanggulangan: Seseorang telah memposting artikel penanggulangan. Untuk detailnya, silakan merujuk ini. "Bagaimana Program Pencuri ASP Menggunakan XMLHTTP untuk mengimplementasikan pengiriman formulir dan cookie atau pengiriman sesi"
Saran: Saat ini tidak ada saran yang baik untuk perbaikan
Komentar: Disarankan agar webmaster yang mengharapkan mesin pencari membawa lalu lintas untuk tidak menggunakan metode ini. Namun, metode ini efektif terhadap prosedur pengumpulan umum.
5. Gunakan skrip JavaScript dan VBScript untuk memberi paginat
Kekurangan: Mempengaruhi mesin pencari untuk memasukkannya
Kumpulkan Penanggulangan: Analisis skrip JavaScript dan VBScript, cari tahu aturan paging mereka, dan buat halaman koleksi paging sesuai dengan situs ini sendiri.
Saran: Saat ini tidak ada saran yang baik untuk perbaikan