بسبب متطلبات المشروع ، هناك حاجة إلى معلومات العلامة التجارية للمركبة ومعلومات نظام المركبات. بالأمس ، أمضيت يومًا في دراسة معلومات موقع JSoup للزحف. يتم كتابة المشروع باستخدام Maven+Spring+SpringMVC+MyBatis.
عنوان دليل تطوير JSoup
هذا هو عنوان الموقع الذي يحتاج إلى الزحف https://car.autohome.com.cn/zhaoche/pinpai/
1. إضافة التبعيات أولاً في pom.xml
لأنني بحاجة إلى حفظ الصورة محليًا ، أضفت حزمة Commons-Net.
<!-https://mvnrepository.com/artifact/org.jsoup/jsoup-> <reperency> <roupend> org.jsoup </groupid> <Stifactid> jsoup </stifactid> <splex> 1.10.3 </sperence> </reperency> <!- https://mvnrepository.com/artifact/commons-net/commons-net-> <sependency> <roupiD> commons-net </rougiD> <StifactId> المشاعون net </artifactid> <sored> 3.3 </version> </
2. تنفيذ رمز الزاحف
@controller@requestMapping ("/car/") class carcontroller {// Image Save Path private Static Final String SaveImgPath = "C: // IMGS" ؛ /** * title: أدخل اسم العلامة التجارية والزحف الصورة وإضافة * description: * param athrows ioException * return void * @throws * date 29 يناير ، 2018 في 4:42:57 pm * // @ @reclespapp ( "https://car.autohome.com.cn/zhaoche/pinpai/" ؛ // احصل على مستند مستند نص صفحة الويب = jsoup.connect (url) .get () ؛ // احصل على محتوى النص استنادًا إلى عناصر اسم الفئة ElementsByClass = doc.getElementsByClass ("Uibox-Con") ؛ // transf مجموعة الفئة لـ (العنصر العنصر: elementsbyclass) {// احصل على عدد علامات الطفل للفئة int childnodesize_1 = element.childnodesize () ؛ // loop للحصول على المحتوى في علامة الطفل لـ (int i = 0 ؛ i <childnodesize_1 ؛ i ++) {// احصل على سلسلة صورة شعار السيارة tupian = element.child (i) .Child (0) .Child (0) .Child (0). // احصل على سلسلة العلامة التجارية pinpai = element.child (i) .Child (0) .Child (1) .Text () ؛ // إخراج المحتوى لمعرفة ما إذا كان صحيحًا system.out.println ("صورة شعار السيارة العنوان ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- url (tupian_1) ؛ ملف (SaveImgPath ، ImageName) ؛ كل ما تحتاجه إلى الحصول على اسم مصنع المشروع المشترك وشركاته الفرعية* // الحصول على عدد سلسلة السيارات intnodesize_2 = element.child (i) .Child (1) .Child (0) .ChildNodesize () ؛ element.child (i) .Child (1) .ChildNodesize () ؛ element.child (i) .Child (1). مصنع Venture على التوالي (int j = 0 ؛ j <childnodesize_3 ؛ j ++) {int childnodesize_4 = element.child ( سلسلة معلومات المصنع المشتركة Hezipinpai = element.child (i) .Child (1) .Child (J) .Child (0). // يحصل على معلومات نظام المركبات في مصنع المشروع (int l = 0 ؛ l <childnodesize_4 ؛ l ++) } system.out.println ("*******************") ؛3. نتائج التشغيل
ما سبق هو كل محتوى هذه المقالة. آمل أن يكون ذلك مفيدًا لتعلم الجميع وآمل أن يدعم الجميع wulin.com أكثر.