Devido aos requisitos do projeto, são necessárias informações sobre a marca do veículo e informações do sistema de veículos. Ontem, passei um dia estudando informações do site da JSUP. O projeto é escrito usando o maven+spring+springmvc+mybatis.
Endereço do Guia de Desenvolvimento JSUPUP
Este é o endereço do site que precisa ser rastreado https://car.autohome.com.cn/zhaoche/pinpai/
1. Primeiro, adicione dependências em pom.xml
Como preciso salvar a imagem localmente, adicionei o pacote Commons-Net.
<!-https://mvnrepository.com/artifact/org.jsoup/jsoup-> <pendency> <voundid> org.jsoup </groupid> <stifactId> jsoup </ArtifactId> <Versão> 1.10.3 </versão </dependência> <!-! https://mvnrepository.com/artifact/commons-nalt/commons-net-> <pendency> <puperiD> commons-net </roupidId> <stifactId> commons-net </stifactId> <versão> 3.3 </versão </dependency>
2. Implementação do código de rastreador
@Controlador@requestmapping ("/car/") classe pública Carcontroller {// Caminho de economia de imagem private estático final string saveImgpath = "c: // imgs"; /** * @title: Insira o nome da marca e a imagem rastejando e adicionando * @Description: * @param @throws ioexception * @return void * @throws * @Date 29 de janeiro de 2018 às 4:42:57 PM */@RequestMapping ("add") o vazio public insert () TOWS IOException { "https://car.autohome.com.cn/zhaoche/pinpai/"; // Obtenha o documento de texto da página da web doc = jsoup.connect (url) .get (); // Obtenha o conteúdo do texto com base no nome da classe ElementsByClass = doc.getElementsByClass ("UiBox-Con"); // transf a coleção da classe para (elemento elemento: elementsByclass) {// obtenha o número de tags infantis da classe int childnodesize_1 = element.childnodesize (); // loop para obter o conteúdo na tag infantil para (int i = 0; i <childnodesize_1; i ++) {// Obtenha o logotipo da imagem do logotipo da imagem string tupian = element.child (i) .child (0) .child (0) .child (0) .child (0) .ttr ("src"); // Obtenha a marca String pinpai = element.Child (i) .Child (0) .CHILD (1) .Text (); // Emitida o conteúdo para ver se está correto System.out.println ("Imagem do logotipo do carro Endereço ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- Url (tupian_1); FileOutputStream (NOVO FILE (SaveImgPath, Imagename)); Volkswagen* Todos precisam andar de bicicleta para obter o nome da fábrica de joint venture e suas subsidiárias*/// obtenha o número de séries de carros Int Childnodesize_2 = Element.Child (i) .Child (1). CHILD (0). Childnodesize_3 = elemento.Child (i) .Child (1) .ChildNodesize (); Element.Child (i) .Child (1) .CHILD (0) .CHILD (J) .CHILD (0) .CHILD (0) .CHILD (0) .Text (); Fábrica de venture, respectivamente, para (int j = 0; j <Childnodesize_3; j ++) {int childnodesize_4 = element.child (i) .child (1) .child (j) .childnodesize (); Informações sobre joint venture String hezipinpai = Element.Child (i) .Child (1) .Child (J) .Child (0) .Text (); // obtém ciclicamente as informações do sistema de veículos da fábrica de joint venture para (int l = 0; l <childnodesize_4; l ++) {string chexi = element.Child (i) .Child (1) .Child (J). } System.out.println ("*********************");3. Resultados da operação
O exposto acima é todo o conteúdo deste artigo. Espero que seja útil para o aprendizado de todos e espero que todos apoiem mais o wulin.com.