Xidel ist ein Befehlszeilen -Tool zum Herunterladen und Extrahieren von Daten aus HTML/XML -Seiten mit CSS -Selektoren, XPath/XQuery 3.0 sowie mit JSONIQ -JSE -Dateien oder APIs (z. B. Rest).
Es gibt abhängigen Binärdateien für Windows, Linux und Mac.
Es handelt sich um einen Wrapper um meine Pascal -Internet -Tools (siehe Repository -Internettools). Daher unterstützt es XPath 2.0, XPath 3.0, XQuery 1.0, XQuery 3.0, JSONIQ, CSS -Selektoren und meine eigenen Erweiterungen/Sprachen (z. B. Muster -Matching) und wenn Sie dieses Projekt zusammenstellen können, können Sie Xidel kompilieren.
Ein einfaches Beispiel, um die Titel aller von einer Startseite verknüpften Seiten zurückzugeben:
xidel http://example.org --follow //a --extract //title
oder einfacher
xidel http://example.org -f //a -e //title
Die Sprache kann explizit ausgewählt werden. Zum Beispiel
xidel input.html --css 'a'
xidel input.html --xpath '//a/@href'
xidel input.html --xquery 'for $var in //a order by $var return $var'
Gibt alle Links, die Ziel -URI jedes Links oder den Text aller Links alphabetisch zurück.
Es gibt weitere Beispiele auf der obigen Seite mit Binärdateien, dem Github -Wiki und in den Beispielen für Verzeichnisse.
Sie können es kompilieren, indem Sie build.sh anrufen und installieren, indem Sie build.sh -t anrufen. Alternativ können Sie es mit der Lazarus -IDE kompilieren.
Sie können die Befehle aus dem Skript von .Travis.yml aufrufen, um Abhängigkeiten herunterzuladen.