Aus dem zuvor erwähnten Sammelprinzip können Sie feststellen, dass die meisten Sammelprogramme auf Analysebegeln für die Sammlung stützen, z. B. die Analyse der Regeln für Paging -Dateinamen und die Analyse der Seitencoderegeln.
1. Verhinderung der Sammlung von Paging -Dateinamen
Die meisten Sammler verlassen sich auf die Analyse der Paging-Dateinamenregeln, um die Stapel- und Multi-Seiten-Sammlung durchzuführen. Wenn andere die Dateinamenregeln für Ihre Paging -Datei nicht finden können, können andere nicht mehrere Seiten Ihrer Website in Stapeln sammeln.
Implementierungsmethode:
Ich denke, das Verschlingen von Paging -Dateinamen mit MD5 ist ein besserer Weg. Wenn Sie davon sprechen, werden einige Personen sagen, dass andere Ihre Verschlüsselungsregeln auch simulieren können, um Ihre Paging -Dateinamen gemäß dieser Regel zu erhalten.
Ich möchte darauf hinweisen, dass, wenn wir den Paging -Dateinamen verschlüsseln, nicht nur den Teil verschlüsseln, der den Dateinamen ändert
Wenn ich die Seitennummer der Seite darstelle, sollten wir sie nicht so verschlüsseln: page_name = md5 (i, 16) & ". Htm"
Es ist am besten, ein oder mehrere Zeichen auf der Seitennummer zu verfolgen, die verschlüsselt werden sollen, wie z.
Da MD5 nicht entschlüsselt werden kann, sind die Seitenbriefe, die andere sehen, das Ergebnis einer MD5 -Verschlüsselung, sodass der Addierer nicht wissen kann, was die Briefe, die Sie nach mir folgen, nicht wissen, es sei denn, er verwendet Gewalt **** md5, aber es ist nicht realistisch.
2. Verhinderung der Sammlung von Seitencoderegeln
Wenn unsere Inhaltsseite keine Coderegeln enthält, können andere die Inhalte, die sie benötigen, nicht aus Ihrem Code extrahieren. Der Schritt, den wir zur Verhinderung der Sammlung benötigen, besteht darin, den Code frei von Regeln zu gestalten.
Implementierungsmethode:
Randomisieren Sie die Marker, die die andere Partei extrahieren muss
1. Passen Sie mehrere Webvorlagen an. Die wichtigen HTML -Tags in jeder Webvorlage sind unterschiedlich. Wählen Sie beim Präsentieren des Seiteninhalts zufällig Webvorlagen aus. Einige Seiten sind Layout mit CSS+DIV und auf einigen Seiten sind Layout mit Tisch. Diese Methode ist etwas problematisch. Für eine Inhaltsseite müssen Sie mehrere weitere Vorlagenseiten erstellen. Anti-Collection ist jedoch eine sehr langwierige Sache. Mehr Vorlagen zu machen können eine Rolle bei der Verhinderung der Sammlung spielen, was sich für viele Menschen lohnt.
2. Wenn die obige Methode zu problematisch ist, randomisieren Sie die wichtigen HTML -Tags auf der Webseite.
Je mehr Webvorlagen Sie machen, desto zufälliger ist der HTML -Code. Je mehr Schwierigkeiten es sein wird, wenn die andere Partei den Inhaltscode analysiert. Wenn die andere Partei eine Sammelstrategie für Ihre Website schreibt, wird sie schwieriger. Zu diesem Zeitpunkt werden sich die meisten Menschen zurückziehen, weil diese Person faul ist und Daten von Websites anderer Personen sammelt. Derzeit verwenden die meisten Menschen Sammelprogramme, die von anderen entwickelt wurden, um Daten zu sammeln. Schließlich gibt es einige Personen, die Sammelprogramme entwickeln, um Daten selbst zu sammeln.
Es gibt einige einfache Ideen für Sie:
1. Verwenden Sie Client -Skripte, um Inhalte anzuzeigen, die für Datensammler wichtig sind, jedoch nicht für Suchmaschinen.
2. Die Aufteilung einer Datenseite in n Seiten ist auch eine Möglichkeit, die Schwierigkeit der Sammlung zu erhöhen.