Code d'implémentation pour le flux Web à l'aide de Phantomjs

Auteur：Eve Cole Date de mise à jour：2025-05-16 11:48:02

Étant donné que Phantomjs est un navigateur sans tête qui peut exécuter JS, il peut également exécuter des nœuds DOM, qui est la meilleure façon de l'utiliser pour le robinet Web.

Par exemple, nous voulons explorer le contenu de la page Web "Today in History". site web

Après avoir observé la structure DOM, nous devons seulement obtenir la valeur du titre de .List li a. Nous utilisons donc un sélecteur avancé pour construire des fragments DOM

 var d = '' var c = document.QuerySelectorall ('. list li a') var l = c.length; for (var i = 0; i <l; i ++) {d = d + c [i] .title + '/ n'}

Après cela, il suffit de laisser le code JS s'exécuter dans Phantomjs ~

 var page = require ('webpage') .create (); page.open ('http://www.todayonhistory.com/', fonction (status) {// ouvrez la page if (status! == 'Success') {console.log ('échouer Document.QuerySelectorAll ('. List li a') var l = c.length; for (var i = 0; i <l; i ++) {d = d + c [i] .title + '/ n'} return d}))} phantom.exit ();});

Enfin, nous enregistrons sous Catch.js, l'exécutons en DOS et sortions le contenu du fichier txt (vous pouvez également utiliser l'API de fichier Phantomjs pour écrire)