JSOUP เป็นเครื่องมือแยกวิเคราะห์ HTML ที่มีประโยชน์มาก เมื่อใช้งานคุณต้องดาวน์โหลดแพ็คเกจ JAR ที่เกี่ยวข้อง
ด้านล่างนี้เป็นซอร์สโค้ด Java สำหรับการใช้งาน JSOUP ของฉันเพื่อแยกวิเคราะห์ตาราง HTML
มีการทดสอบส่วนบุคคล!
Public Void Parse () {String htmlstr = "<table id = kbtable>"+ "<tr>"+ "<td width = 123>"+ "<div id = 12> นี่คือข้อมูลที่จะได้รับ 1 </div>"+ "<div id = 13> นี่คือข้อมูลที่จะได้รับ 2 </div>"+ " ข้อมูลที่จะได้รับ 3 </div> "+" <div id = 13> นี่คือข้อมูลที่จะได้รับ 4 </div> "+" </td> "+" </tr> "+" </table> "เอกสารเอกสาร = jsoup.parse (htmlstr); trs = table.select ("tr"); // ความเงียบสงบผ่านทั้งหมด <tr> <tr // สำหรับ (int i = 0; i <trs.size (); ++ i) {// รับ trelement tr = trs.get (i); ++ j) {องค์ประกอบ td = tds.get (j); // รับการแบ่งแยกทั้งหมดของโหนด td node divs = td.select ("div"); // เลือก divfor (int k = 0; k <divs.size (); k ++) {element div = divs.get (k); System.out.println (ข้อความ);}}}}ตัวอย่างข้างต้นของข้อมูลข้อความในตารางที่ใช้ JSOUP เพื่อแยกวิเคราะห์ HTML เป็นเนื้อหาทั้งหมดที่ฉันแบ่งปันกับคุณ ฉันหวังว่าคุณจะให้ข้อมูลอ้างอิงและฉันหวังว่าคุณจะสนับสนุน wulin.com มากขึ้น