XIDEL adalah alat baris perintah untuk mengunduh dan mengekstrak data dari halaman HTML/XML menggunakan selektor CSS, XPath/XQuery 3.0, serta menanyakan file JSON atau API (misalnya IST) menggunakan JSONIQ.
Ada biner bebas ketergantungan untuk Windows, Linux dan Mac.
Ini adalah pembungkus di sekitar alat internet Pascal saya (lihat Repositori Internettools), sehingga mendukung XPath 2.0, XPath 3.0, XQuery 1.0, XQuery 3.0, JSONIQ, Selector CSS dan ekstensi/bahasa saya sendiri (pencocokan pola EG) dan jika Anda dapat mengkompilasi proyek itu, Anda dapat mengumpulkan Xidel.
Contoh sederhana untuk mengembalikan judul semua halaman yang ditautkan oleh beberapa halaman awal:
xidel http://example.org --follow //a --extract //title
atau lebih sederhana
xidel http://example.org -f //a -e //title
Bahasa dapat dipilih secara eksplisit. Misalnya
xidel input.html --css 'a'
xidel input.html --xpath '//a/@href'
xidel input.html --xquery 'for $var in //a order by $var return $var'
Mengembalikan semua tautan, target URI dari setiap tautan atau teks dari semua tautan secara abjad.
Ada lebih banyak contoh pada halaman di atas dengan binari, wiki github dan dalam contoh direktori.
Anda dapat mengkompilasinya dengan menelepon build.sh dan menginstalnya dengan menelepon build.sh -t . Atau Anda dapat mengkompilasinya dengan Lazarus IDE.
Anda dapat memanggil perintah dari skrip .travis.yml untuk mengunduh dependensi.