Из -за требований к проекту необходима информация о марке автомобилей и информацию о системе транспортных средств. Вчера я провел день, изучая информацию о ползании JSoup. Проект написан с использованием Maven+Spring+Springmvc+Mybatis.
Руководство по разработке JSoup
Это адрес веб -сайта, который необходимо ползти https://car.autohome.com.cn/zhaoche/pinpai/
1. Сначала добавьте зависимости в pom.xml
Поскольку мне нужно сохранить изображение локально, я добавил пакет Commons-Net.
<!-https://mvnrepository.com/artifact/org.jsoup/jsoup-> <deposity> <groupid> org.jsoup </GroupId> <straCactId> jsoup </artifactid> <sersive> 1.10.3 </version> </vehing> <!---! https://mvnrepository.com/artifact/commons-net/commons-net-> <dehyederiation> <groupid> commons-net </GroupId> <artifactid> commons-net </artifactid> <sersive> 3.3 </version> </зависимость>
2. Реализация кода Crawler
@Controller@requestmapping ("/car/") public class carcontroller {// partice seving path private static final string saveimgpath = "c: // imgs"; /** * @title: вставьте название бренда и ползание изображений и добавление * @description: * @param @throws ioexception * @return void * @Throws * @Date 29 января 2018 в 16:42:57 */@Requestmapping ("добавить") public insert () throws {//@Requestmapp "https://car.autohome.com.cn/zhaoche/pinpai/"; // Получить веб -страницу текстовый документ doc = jsoup.connect (url) .get (); // Получение текстового контента на основе элементов имени класса Elementsbyclass = doc.getElementsbyclass ("uibox-con"); // Трансф коллекции класса для (элемент элемента: elementsbyclass) {// Получить количество дочерних тегов класса int childnodesize_1 = element.childnodesize (); // цикл, чтобы получить контент в детской теге для (int i = 0; i <childnodeSize_1; i ++) {// Получить адрес образа логотипа автомобиля tpian = element.child (i) .child (0) .child (0) .child (0) .child (0) .attr ("src"); // Получить название бренда String pinpai = element.child (i) .child (0) .child (1) .Text (); // Вывод содержимого, чтобы увидеть, является ли это правильной system.out.println ("Car Logo Image address----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- URL url1 = new URL (TUPIAN_1); File (SaveImgpath, ImageName); Необходимо ездить на велосипеде, чтобы получить название совместного предприятия и ее дочерних компаний*/// Получить количество серии CAR int Childnodesize_2 = element.child (i). Child (1). Child (0) .ChildNodeSize (); element.child (i) .child (1) .childnodesize (); element.child (i) .child (1) .child (0) .Child (j) .Child (0) .Child (0) .Child (0) .Text (); Венчурная фабрика соответственно для (int j = 0; j <childnodesize_3; j ++) {int childnodesize_4 = element.child (i) .child (1) .child (j) .ChildNodesize (); Совместное предприятие Информационная строка hezipinpai = element.child (i) .child (1) .child (j) .Child (0) .Text (); // Циклически получает информацию о системе транспортных средств совместного предприятия для (int l = 0; l <childnodesize_4; l ++) {string chexi = element.child (i) .child (1) .child (j). Child (l) .Child (0) .Child (0) .Text (); } System.out.println ("*******************3. Результаты работы
Выше всего содержание этой статьи. Я надеюсь, что это будет полезно для каждого обучения, и я надеюсь, что все будут поддерживать Wulin.com больше.