Используйте Java, чтобы захватить все изображения на веб -странице:
Используйте два регулярных выражения:
1. Регулярное соответствие метки IMG в HTML: <img.*Src = (.*?) [^>]*?>
2. Сопоставьте путь HTTP в SRC в теге IMG: http:/"? (.*?) (/" |> | // s+)
выполнить:
пакет org.swinglife.main; Импорт java.io.file; Импорт java.io.fileOutputStream; импортировать java.io.inputstream; импортировать java.net.url; Импорт java.net.urlconnection; импортировать java.util.arraylist; импортировать java.util.list; импортировать java.util.regex.matcher; Импорт java.util.regex.pattern; /**** Java Crawl Network Images* @Author SwingLife**/Public Class Catchimage {// Адрес частной статической конечной строки url = "http://www.csdn.net"; // кодирование частной статической конечной строки eCoding = "utf-8"; // Получить IMG TAG регулярной частной статической конечной строки imgurl_reg = "<img.*Src = (.*?) [^>]*?>"; // Получить путь SRC регулярной частной статической конечной строки imgsrc_reg = "http:/"? (.*?) (/"|> | // s+)"; public static void main (string [] args) бросает исключение {catchimage cm = new Catchimage (); // Получить html текстового содержимого строки html = cm.gethtml (url); // Получить список тегов изображения <string> imgurl = cm.getimageurl (html); // Получить изображение списка адресов src <string> imgsrc = cm.getimagesrc (imgurl); // Загрузите изображение cm.download (imgsrc); } / *** * GET HTML Content * * @param url * @return * @throhs excection * / private string gethtml (string url) выбрасывает исключение {url uri = new url (url); UrlConnection Connection = uri.openconnection (); InputStream in = connection.getInputStream (); byte [] buf = new Byte [1024]; int length = 0; StringBuffer sb = new StringBuffer (); while ((length = in.read (buf, 0, buf.length))> 0) {sb.append (new String (buf, ecoding)); } in.close (); вернуть sb.toString (); } / *** * Получить ImageUrl Adder * * @param html * @return * / private list <string> getimageurl (string html) {matchter matcher = pattern.compile (imgurl_reg) .matcher (html); List <string> listimgurl = new ArrayList <string> (); while (matcher.find ()) {listimgurl.add (matcher.group ()); } return listimgurl; } / *** * GET ImagesRC Адрес * * @param Listimageurl * @return * / private list <string> getimagesrc (list <string> listimageurl) {list <string> listimgsrc = new ArrayList <string> (); for (String Image: listimageurl) {matchter matcher = pattern.compile (imgsrc_reg) .matcher (image); while (matcher.find ()) {listimgsrc.add (matcher.group (). substring (0, matcher.group (). length () - 1)); }} return listimgsrc; }/**** Скачать изображение** @param listimgsrc*/private void загрузка (list <string> listimgsrc) {try {for (string url: listimgsrc) {string ImageName = url.substring (url.lastidexof ("/") + 1, url.length ()); Url uri = new URL (URL); InputStream in = uri.openstream (); FileOutputStream fo = new FileOutputStream (новый файл (ImageName)); byte [] buf = new Byte [1024]; int length = 0; System.out.println ("Start Download:" + url); while ((length = in.read (buf, 0, buf.length))! = -1) {fo.write (buf, 0, длина); } in.close (); fo.close (); System.out.println (ImageName + "Загрузить заполнение"); }} catch (Exception e) {System.out.println ("Скачать не удалось"); }}}Выше всего содержание этой статьи. Я надеюсь, что это будет полезно для каждого обучения, и я надеюсь, что все будут поддерживать Wulin.com больше.