Aufgrund der Projektanforderungen sind Informationen und Fahrzeugsysteminformationen erforderlich. Gestern habe ich einen Tag damit verbracht, JSOUP Crawling -Website -Informationen zu studieren. Das Projekt wird mit Maven+Spring+SpringMVC+MyBatis geschrieben.
JSOUP Development Guide Adresse
Hier
1. Fügen Sie zunächst Abhängigkeiten in pom.xml hinzu
Da ich das Bild lokal speichern muss, habe ich das Commons-Net-Paket hinzugefügt.
<!-https://mvnrepository.com/artifact/org.jsoup/JSOUP-> <De vor Ort> <gruppe> org.jSoup </Groupid> <artifactid> jSOUP </artifactid> <version> 1.10.3 </Version> </abhängig> <! https://mvnrepository.com/artifact/commons-net/commons-net-> <depepecy> <gruppe> commons-net </Groupid> <artifactid> commons-net </artifactid> <version> 3.3 </Version> </abhängig>
2. Implementierung von Crawler Code
@Controller@RequestMapping ("/car/") public class carcontroller {// Image Saving Path private statische String SaveImgPath = "c: // imgs"; /** * @title: Markenname und Bild einfügen Crawling und Hinzufügen * @Description: * @param @throw ioException * @return void * @throw * @date 29. Januar 2018 um 4:42:57 PM */@Requestmapping ("addieren") public void blows throws ioException ioException {// ///////////////////////////////////. "https://car.autohome.com.cn/zhaoche/pinpai/"; // das Webseite Textdokument doc = jsoup.connect (url) .get () abrufen; // den Textinhalt basierend auf den Klassennamen Elements ElementsByclass = doc.getElementsByClass ("UiBox-con") abrufen; // Die Sammlung der Klasse für (Elementelement: ElementsByClass) {// Die Anzahl der untergeordneten Tags der Klasse int Childnodesize_1 = Element.Childnodessize () erhalten; // Schleife, um den Inhalt in das untergeordnete Tag für (int i = 0; i <Childnodesize_1; i ++) {// Die Car -Logo -Bildadresse String tupian = element.child (i) .Child (0) .Child (0) .Child (0) .Child (0) .attr ("src") abzurufen. // den Markennamen String pinpai = element.child (i) .Child (0) .Child (1) .Text (); // Ausgabe des Inhalts, um festzustellen, ob es korrekt ist. Adresse -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- URL (TUPIAN_1); FileOutputStream (neue Datei (SaveImgPath, ImageName)); Importiertes Volkswagen* Alle müssen den Namen der Joint Venture-Fabrik und seine Tochtergesellschaften erwerben Childnodesize_3 = Element.Child (i) .Child (1) .Childnodesize (); Element.Child (i) .Child (1) .Child (0) .Child (j) .Child (0) .Child (0) .Child (0) .Text (); Venture -Fabrik für (int j = 0; j <Childnodesize_3; j ++) {int Childnodesize_4 = child (i) .Child (1) .Child (j) Joint Venture-Fabrik-Information String HEZIPINPAI = Element.Child (i) .Child (1) .Child (j) .Child (0) .Text (); // zyklisch die Informationen des Fahrzeugsystems der Joint Venture-Fabrik für (int l = 0; l <childnodesze_4; l ++) {String chexi = element.child (i) .Child (1) .Child (j) .Child (l) .Child (0) .Child (0). } System.out.println("*********************"); System.out.println("***************************"); } } }}3. Betriebsergebnisse
Das obige ist der gesamte Inhalt dieses Artikels. Ich hoffe, es wird für das Lernen aller hilfreich sein und ich hoffe, jeder wird Wulin.com mehr unterstützen.