نظرًا لأن Phantomjs عبارة عن متصفح مقطوع الرأس يمكنه تشغيل JS ، يمكنه أيضًا تشغيل عقد DOM ، وهي أفضل طريقة لاستخدامها في تزحف الويب.
على سبيل المثال ، نريد تزوير محتوى صفحة الويب "اليوم في التاريخ". موقع إلكتروني
بعد مراقبة بنية DOM ، نحتاج فقط إلى الحصول على قيمة عنوان .list li a. لذلك نستخدم المحدد المتقدم لبناء شظايا DOM
var d = '' var c = document.queryselectorall ('. list li a') var l = c.length ؛ for (var i = 0 ؛ i <l ؛ i ++) {d = d+c [i] .title+'/n'}بعد ذلك ، فقط يجب أن تدع رمز JS يعمل في phantomjs ~
var page = require ('webpage') .create () ؛ page.open ('http://www.todayonhistory.com/' ، function (status) {// افتح الصفحة if (status! == 'success') {console.log ('fail to addrate') ؛} {console.log (page. document.queryselectorall ('. list li a') var l = c.length ؛ for (var i = 0 ؛ i <l ؛ i ++) {d = d+c [i] .title+'/n'} return d}))} phantom.exit () ؛}) ؛أخيرًا ، نقوم بحفظها على أنها catch.js ، وننفذها في DOS ، وإخراج المحتوى إلى ملف TXT (يمكنك أيضًا استخدام واجهة برمجة تطبيقات ملف phantomjs للكتابة)