現在、収集を防ぐには多くの方法があります。まず、一般的な反収集戦略、それらの欠点、および収集対策を紹介しましょう。
1.一定期間内にIPでこのWebサイトページへの訪問数を決定します。明らかに通常のブラウジング速度を超えた場合、IPは拒否されます。
短所:
1.この方法は、ASP/JSP/PHPなどの動的ページにのみ適用できます。...静的ページは、特定のIPがこのサイトのページにアクセスする回数を特定の期間決定できません。
2.この方法は、検索エンジンのクモを含めると、ブラウジング速度が比較的高速でマルチスレッドになるため、検索エンジンのクモの包含に深刻な影響を及ぼします。この方法は、サイトに含まれる検索エンジンスパイダーのファイルも拒否します
収集戦略:収集速度を遅くする、またはしないでください
提案:検索エンジンスパイダーIPライブラリを作成します。これにより、検索エンジンクモのみがサイトのコンテンツをすばやく閲覧できます。検索エンジンクモのIPライブラリを収集するのは簡単ではありません。検索エンジンスパイダーには、必ずしも固定IPアドレスが1つしかないわけではありません。
コメント:この方法は、収集を防ぐためにより効果的ですが、検索エンジンの包含に影響します。
2。JavaScriptを使用してコンテンツページを暗号化します
短所:この方法は静的ページに適していますが、検索エンジンの含有に深刻な影響を及ぼします。検索エンジンが受信したコンテンツも暗号化されます。
対策の収集:選択しないことをお勧めします。選択する必要がある場合は、パスワードを復号化するJSスクリプトを選択することもできます。
提案:現在、改善のための良い提案はありません
コメント:検索エンジンがこの方法を使用しないようにトラフィックをもたらすことを期待するウェブマスターをお勧めします。
3.コンテンツページの特定のマークを「特定のマーク +非表示の著作権テキスト」に置き換えます
短所:この方法にはほとんど欠点があり、ページファイルのサイズが大きくなるだけですが、コレクションを簡単に逆転させることができます。
収集戦略:隠された著作権テキストコンテンツで収集された著作権で保護されたテキストを置き換えるか、独自の著作権に置き換えます。
提案:現在、改善のための良い提案はありません
コメント:私はそれがあまり実用的ではないと感じています。ランダムな非表示の単語を追加しても、さらに追加することと同等です。
4.ログイン後にユーザーが閲覧できるようにします
欠点:この方法は、検索エンジンクモの含有に深刻な影響を与えるでしょう
対策の収集:誰かが対策記事を投稿しました。詳細については、これを参照してください。 「ASP ThiefプログラムはXMLHTTPを使用して、フォームの提出とCookieまたはセッションの送信をどのように実装していますか」
提案:現在、改善のための良い提案はありません
コメント:検索エンジンがこの方法を使用しないようにトラフィックをもたらすことを期待するウェブマスターをお勧めします。ただし、この方法は一般的な収集手順に対して効果的です。
5。JavaScriptとVBScriptスクリプトを使用してページングします
短所:検索エンジンに影響を与えて含める
対策を収集する:JavaScriptとVBScriptスクリプトを分析し、ページングルールを見つけ、自分でこのサイトに対応するページングコレクションページを作成します。
提案:現在、改善のための良い提案はありません