Das Beispiel in diesem Artikel beschreibt die Methode zum Erfassen von E-Mail-Adressen auf Webseiten in Java. Teilen Sie es als Referenz mit allen. Die spezifische Implementierungsmethode ist wie folgt:
Kopieren Sie den Code wie folgt: import java.io.BufferedReader;
import java.io.InputStreamReader;
java.net.URL importieren;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
öffentliche Klasse h1
{
öffentlicher statischer String getWebCon(String domain)
{
System.out.println("Beginnen Sie mit dem Erfassen von E-Mail-Adressen..("+domain+")");
StringBuffer sb=new StringBuffer();
versuchen
{
java.net.URL url=neue java.net.URL(domain);
BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));
String-Linie;
while((line=in.readLine())!=null)
{
parse(line);
}
in.close();
}
Catch (Ausnahme e)
{
sb.append(e.toString());
System.err.println(e);
}
return sb.toString();
}
public static void main(String[] args)
{
String s;
s=h1.getWebCon("http://post.baidu.com/f?kz=34942387"); //Dies ist die zu crawlende Webseite, Sie können es selbst ausprobieren.
//System.out.println(s);
}
private static void parse(String line)
{
Muster p=Pattern.compile("[//w[.-]]+@[//w[.-]]+//.[//w]+");//Regulärer Ausdruck für Postfach
Matcher m=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
}
Ich hoffe, dass dieser Artikel für die Java-Programmierung aller hilfreich sein wird.