Verwenden Sie die regelmäßige Erfassung von Online -Postfächern
Dies ist die Website, die wir erfassen müssen.
Implementierungsideen:
1. Verwenden Sie das Objekt java.net.url, um die Adresse einer bestimmten Webseite im Netzwerk zu binden.
2. Erreichen Sie ein httpConnection -Objekt über die Methode openConnection () des Objekts java.net.url
3. Erreichen Sie das Eingabestream -Objekt der Netzwerkdatei über die Methode GetInputStream () des HTTPConnection -Objekts.
4. Schleifen Sie die Lesen jeder Datenzeile im Stream und der reguläre Ausdrucksbereich, der vom Musterobjekt zusammengestellt wurde, mit jeder Zeichenzeile, um die E -Mail -Adresse zu erhalten
Hier ist unser Code:
Paket cn.bdqn; import java.io.bufufferedReader; import java.io.ioxception; import Java.io.inputStreamReader; // Betrieb im Zusammenhang mit dem Netzwerk importieren java.net.url; importieren java.net.urlconnection; E -Mail * @Author Happy * */public class Test {public static void main (String [] args) löst ioException aus {//1.1 Erstellen Sie eine url url url = new url ("https://www.douban.com/group/topic/8845032/"); //1.2 Öffnen Sie die Verbindung urlConnection conn = url.openconnection (); //1.3 Legen Sie die Zeitüberschreitungseinheit für das Verbindungsnetzwerk auf Milliseconds Conn.SetConnectTimeout (1000 * 10) fest; //1.4 Lesen Sie die Datei in der angegebenen Netzwerkadresse über Stream Operations BufferedReader buf = new bufferedReader (neuer InputStreamReader (Conn.GetInputStream ())); String line = null; //1.5 regulärer String Regex für die Übereinstimmung mit E-Mail = "[a-za-z0-9 _-]+@// w+//. [Az]+(//. [Az]+)?"; //1.6 Verwenden Sie die Methode compile () des Musters, um das Muster -Objekt -Muster p = mustern.com (Regex) zu erzeugen; // 1. while ((line = buffr.readline ())! = null) {Matcher m = p.matcher (line); while (m.find ()) {System.out.println (m.group ()); // Erhalten Sie die passende E -Mail}}}}}Hier verwenden wir hauptsächlich die Regelmäßigkeit, um E -Mails zu entsprechen:
String regex = "[a-za-z0-9 _-]+@// w+//. [Az]+(//. [Az]+)?";
[A-Za-Z0-9_-] kann nur Buchstaben, Zahlen, Unterstriche und minus Zeichen enthalten. "+" bedeutet einmal oder mehrmals [a-za-z0-9_-]. Nach @kann ein Nicht-Single-Zeichen gleich [^a-za-z0-9_] erscheinen. Es kann einmal oder mehrmals erscheinen. Nach dem Ende muss es / /. Welches ist für die Flucht. Dann kann jeder Zeichen zwischen A und Z nach dem Klicken erscheinen.
Die erfassten Ergebnisse sind wie folgt:
Das obige ist der gesamte Inhalt dieses Artikels. Ich hoffe, es wird für das Lernen aller hilfreich sein und ich hoffe, jeder wird Wulin.com mehr unterstützen.