구현 아이디어 :
1. java.net.url 객체를 사용하여 네트워크의 특정 웹 페이지의 주소를 바인딩하십시오.
2. java.net.url 객체의 OpenConnection () 메소드를 통해 httpconnection 객체를 얻습니다.
3. httpconnection 객체의 getInputStream () 메소드를 통해 네트워크 파일의 입력 스트림 객체를 얻습니다.
4. 스트림에서 데이터를 반복하고 패턴 객체에서 편집 한 정규식 영역은 각 문자 라인과 일치하여 이메일 주소를 얻습니다.
패키지 cn.sdhzzl; import java.io.bufferedReader; import java.io.ioException; import java.io.inputStreamReader; // 네트워크 가져 오기 java.net.url과 관련된 작업 java.net.urlconnection; import java.util.regex.matcher; hampor java.util.regex. static void main (string [] args)은 ioexception {//1.1 생성 URL 객체 URL을 만듭니다. //1.2 연결 URLConnection을 엽니 다. conn = url.openConnection (); //1.3 연결 네트워크의 시간 초과 단위를 밀리 초에 밀어 넣습니다. Conn.setConnectTimeout (1000 * 10); //1.4 스트림 작업 BufferedReader bufr = new BufferedReader (new InputStreamReader (conn.getInputStream ()))을 통해 지정된 네트워크 주소에서 파일을 읽습니다. 문자열 라인 = null; //1.5 이메일과 일치하는 일반 문자열 Regex = "[a-za-z0-9 _-]+// w+//. [az]+(//. // 1. while ((line = bufr.readline ())! = null) {matcher m = p.matcher (line); while (m.find ()) {system.out.println (m.group ()); // 일치하는 이메일 가져 오기}}}웹 이메일을 크롤링하기위한 위의 Java 코드는 내가 공유하는 모든 콘텐츠입니다. 나는 당신이 당신에게 참조를 줄 수 있기를 바랍니다. 그리고 당신이 wulin.com을 더 지원할 수 있기를 바랍니다.