이 기사의 예에서는 Java로 웹 페이지에서 이메일 주소를 가져오는 방법을 설명합니다. 참고할 수 있도록 모든 사람과 공유하세요. 구체적인 구현 방법은 다음과 같습니다.
다음과 같이 코드를 복사합니다. import java.io.BufferedReader;
import java.io.InputStreamReader;
java.net.URL 가져오기;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
공개 클래스 h1
{
공개 정적 문자열 getWebCon(문자열 도메인)
{
System.out.println("이메일 주소 수집을 시작합니다..("+domain+")");
StringBuffer sb=new StringBuffer();
노력하다
{
java.net.URL url=새 java.net.URL(도메인);
BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));
스트링라인;
while((line=in.readLine())!=null)
{
구문 분석(라인);
}
넣다();
}
잡기(예외 e)
{
sb.append(e.toString());
System.err.println(e);
}
sb.toString()을 반환합니다.
}
공개 정적 무효 메인(문자열[] 인수)
{
문자열 s;
s=h1.getWebCon("http://post.baidu.com/f?kz=34942387"); //크롤링할 웹페이지입니다. 직접 시도해 볼 수 있습니다.
//System.out.println(s);
}
개인 정적 무효 구문 분석(문자열 라인)
{
패턴 p=Pattern.compile("[//w[.-]]+@[//w[.-]]+//.[//w]+");//사서함에 대한 정규식
일치자 m=p.matcher(line);
동안(m.find())
{
System.out.println(m.group());
}
}
}
이 글이 모든 사람의 Java 프로그래밍에 도움이 되기를 바랍니다.