Hay muchas maneras de evitar la recolección en la actualidad. Permítanme presentar primero las estrategias comunes contra la colección, sus desventajas y contramedidas de recolección:
1. Determine el número de visitas a la página de este sitio web en una IP dentro de un cierto período de tiempo. Si obviamente excede la velocidad de navegación normal, la IP será negada.
Desventajas:
1. Este método solo es aplicable a páginas dinámicas, como: ASP/JSP/PHP, etc. Las páginas estáticas no pueden determinar el número de veces que un cierto IP visita la página de este sitio durante un cierto período de tiempo.
2. Este método afectará seriamente la inclusión de las arañas de los motores de búsqueda, porque cuando la inclusión de las arañas de los motores de búsqueda, la velocidad de navegación será relativamente rápida y múltiple. Este método también rechaza los archivos de las arañas de los motores de búsqueda incluidos en el sitio
Estrategias de recolección: solo disminuya la velocidad de la velocidad de recolección, o no
Sugerencia: haga una biblioteca IP de Search Engine Spider, que solo permite a las arañas de los motores de búsqueda navegar rápidamente por el contenido del sitio. No es fácil recopilar la biblioteca IP de las arañas de los motores de búsqueda. Una araña de motor de búsqueda no necesariamente tiene una dirección IP fija.
Comentario: Este método es más efectivo para prevenir la recolección, pero afectará la inclusión de los motores de búsqueda.
2. Encrypt Páginas de contenido con JavaScript
Desventajas: este método es adecuado para páginas estáticas, pero afectará seriamente la inclusión de los motores de búsqueda. El contenido recibido por los motores de búsqueda también está encriptado.
Recolección de contramedidas: se recomienda no elegir. Si tiene que elegir, también puede elegir el script JS que descifra la contraseña.
Sugerencias: actualmente no hay buenas sugerencias de mejora
Comentario: Se recomienda que los webmasters que esperan que los motores de búsqueda traigan tráfico no usen este método.
3. Reemplace las marcas específicas en la página de contenido con "Marcas específicas + texto oculto de derechos de autor"
Desventajas: este método tiene pocas desventajas, solo aumentará el tamaño del archivo de página, pero es fácil revertir la colección.
Estrategias de recopilación: reemplace el texto con derechos de autor recopilado con contenido de texto de copyright oculto o reemplácelo con sus propios derechos de autor.
Sugerencias: actualmente no hay buenas sugerencias de mejora
Comentario: Siento que no es muy práctico. Incluso si agrego palabras ocultas aleatorias, es equivalente a agregar más.
4. Solo permita a los usuarios navegar después de iniciar sesión
Desventaja: este método afectará seriamente la inclusión de las arañas de los motores de búsqueda
Colección de contramedidas: alguien ha publicado artículos de contramedidas. Para más detalles, consulte esto. "¿Cómo usa el programa ASP Thief XMLHTTP para implementar el envío de formularios y las cookies o el envío de la sesión"
Sugerencias: actualmente no hay buenas sugerencias de mejora
Comentario: Se recomienda que los webmasters que esperan que los motores de búsqueda traigan tráfico no usen este método. Sin embargo, este método es efectivo contra los procedimientos de recolección generales.
5. Use scripts JavaScript y VBScript para paginar
Desventajas: influir en los motores de búsqueda para incluirlo
Recopile contramedidas: analice los scripts de JavaScript y VBScript, descubra sus reglas de paginación y haga una página de colección de paginación correspondiente a este sitio usted mismo.
Sugerencias: actualmente no hay buenas sugerencias de mejora