현재 수집을 방지하는 방법에는 여러 가지가 있습니다. 먼저 일반적인 수집 전략, 그들의 단점 및 수집 대책을 소개하겠습니다.
1. 일정 기간 내에 IP 로이 웹 사이트 페이지 방문 횟수를 결정하십시오. 일반 브라우징 속도를 분명히 초과하면 IP가 거부됩니다.
단점 :
1.이 방법은 ASP/JSP/PHP 등과 같은 동적 페이지에만 적용 할 수 있습니다 .... 정적 페이지는 특정 IP가 특정 시간 동안이 사이트 페이지를 방문하는 횟수를 결정할 수 없습니다.
2.이 방법은 검색 엔진 거미를 포함시킬 때 브라우징 속도가 비교적 빠르고 다중 스레드되기 때문에 검색 엔진 거미의 포함에 심각한 영향을 미칩니다. 이 방법은 또한 사이트에 포함 된 검색 엔진 스파이더 파일도 거부합니다.
전략 수집 : 수집 속도 속도 만 느리게하거나
제안 : 검색 엔진 스파이더 IP 라이브러리를 만들어 검색 엔진 스파이더 만 사이트의 컨텐츠를 빠르게 탐색 할 수 있습니다. Search Engine Spiders의 IP 라이브러리를 수집하는 것은 쉽지 않습니다. 검색 엔진 스파이더에 반드시 고정 IP 주소가 하나뿐입니다.
의견 :이 방법은 수집을 방지하는 데 더 효과적이지만 검색 엔진의 포함에 영향을 미칩니다.
2. JavaScript로 콘텐츠 페이지를 암호화합니다
단점 :이 방법은 정적 페이지에 적합하지만 검색 엔진 포함에 심각한 영향을 미칩니다. 검색 엔진에서받은 콘텐츠도 암호화됩니다.
대책 수집 : 선택하지 않는 것이 좋습니다. 선택 해야하는 경우 비밀번호를 해독하는 JS 스크립트를 선택할 수도 있습니다.
제안 : 현재 개선을위한 좋은 제안은 없습니다
댓글 : 검색 엔진이 트래픽을 가져 오기를 기대하는 웹 마스터는이 방법을 사용하지 않는 것이 좋습니다.
3. 콘텐츠 페이지의 특정 표시를 "특정 마크 + 숨겨진 저작권 텍스트"로 바꾸십시오.
단점 :이 방법에는 단점이 거의 없으며 페이지 파일의 크기 만 증가하지만 컬렉션을 되돌리기가 쉽습니다.
전략 수집 : 숨겨진 저작권 텍스트 콘텐츠로 수집 된 저작권이있는 텍스트를 교체하거나 자신의 저작권으로 바꾸십시오.
제안 : 현재 개선을위한 좋은 제안은 없습니다
의견 : 나는 그것이 실용적이지 않다고 생각합니다. 무작위 숨겨진 단어를 추가하더라도 더 많은 것을 추가하는 것과 같습니다.
4. 로그인 후 사용자가 찾아 볼 수 있도록 허용합니다
단점 :이 방법은 검색 엔진 거미 포함에 심각한 영향을 미칩니다.
대책 수집 : 누군가가 대책 기사를 게시했습니다. 자세한 내용은이를 참조하십시오. "ASP Thief 프로그램은 XMLHTTP를 사용하여 양식 제출 및 쿠키 또는 세션 보내기를 구현하는 방법"
제안 : 현재 개선을위한 좋은 제안은 없습니다
댓글 : 검색 엔진이 트래픽을 가져 오기를 기대하는 웹 마스터는이 방법을 사용하지 않는 것이 좋습니다. 그러나이 방법은 일반 수집 절차에 효과적입니다.
5. JavaScript 및 vbscript 스크립트를 사용하여 Pagination
단점 : 검색 엔진에 영향을 미치는 영향을 미칩니다
대책 수집 : JavaScript 및 vbscript 스크립트를 분석하고 페이징 규칙을 찾은 다음이 사이트에 직접 해당하는 페이징 컬렉션 페이지를 만듭니다.
제안 : 현재 개선을위한 좋은 제안은 없습니다