В настоящее время есть много способов предотвратить сбор. Позвольте мне сначала представить общие стратегии антиколлекции, их недостатки и контрмеры для сбора:
1. Определите количество посещений на этой странице веб -сайта с помощью IP в течение определенного периода времени. Если это, очевидно, превышает нормальную скорость просмотра, IP будет отказана.
Недостатки:
1. Этот метод применим только к динамическим страницам, таким как: ASP/JSP/PHP, и т. Д.
2. Этот метод серьезно повлияет на включение пауков поисковых систем, потому что, когда включение поисковых пауков, скорость просмотра будет относительно быстрой и многопоточной. Этот метод также отклоняет файлы Speaders Spiders, включенные в сайт
Стратегии сбора: только замедлить скорость сбора или не
Предложение: Сделайте библиотеку IP -библиотеки Spider Spead, которая позволяет только поисковым паукам быстро просматривать контент на сайте. Нелегко собрать библиотеку IP -библиотеки поисковых систем. У паука поисковой системы не обязательно есть только один фиксированный IP -адрес.
Комментарий: Этот метод более эффективен для предотвращения сбора, но он повлияет на включение поисковых систем.
2. Зашифровать страницы контента с помощью JavaScript
Недостатки: этот метод подходит для статических страниц, но он серьезно повлияет на включение поисковых систем. Контент, полученный поисковыми системами, также зашифруется.
Сбор контрмеров: рекомендуется не выбирать. Если вам нужно выбрать, вы также можете выбрать сценарий JS, который расшифровывает пароль.
Предложения: в настоящее время нет хороших предложений для улучшения
Комментарий: рекомендуется, чтобы веб -мастера, которые ожидают поисковых систем, не используют этот метод.
3. Замените конкретные оценки на странице содержимого на «конкретные оценки + скрытый текст авторского права»
Недостатки: этот метод имеет небольшие недостатки, он только увеличит размер файла страницы, но легко отменить коллекцию.
Стратегии сбора: замените авторский текст, собранное с помощью скрытого текстового контента об авторском праве, или замените его собственным авторским правом.
Предложения: в настоящее время нет хороших предложений для улучшения
Комментарий: я чувствую, что это не очень практично. Даже если я добавляю случайные скрытые слова, это эквивалентно добавлению большего.
4. Позвольте пользователям просматривать только после входа в систему
Недостаток: этот метод серьезно повлияет на включение пауков поисковых систем
Сбор контрмеров: кто -то опубликовал статьи контрмеров. Для получения подробной информации, пожалуйста, обратитесь к этому. «Как программа ASP Thief использует xmlhttp для реализации формы и файлов cookie или отправки сеанса»
Предложения: в настоящее время нет хороших предложений для улучшения
Комментарий: рекомендуется, чтобы веб -мастера, которые ожидают поисковых систем, не используют этот метод. Однако этот метод эффективен против общих процедур сбора.
5. Используйте сценарии JavaScript и VBScript для
Недостатки: влияние на поисковые системы, чтобы включить их
Соберите контрмеры: проанализируйте сценарии JavaScript и VBScript, выясните их правила пейджинга и сделайте страницу сбора подкачки самостоятельно, соответствующую этому сайту.
Предложения: в настоящее время нет хороших предложений для улучшения