Xidel هي أداة سطر الأوامر لتنزيل واستخراج البيانات من صفحات HTML/XML باستخدام محددات CSS ، XPath/Xquery 3.0 ، بالإضافة إلى استعلام ملفات JSON أو واجهات برمجة التطبيقات (EG REST) باستخدام JSONIQ.
هناك ثنائيات خالية من التبعية لنظام التشغيل Windows و Linux و Mac.
إنه غلاف حول أدوات الإنترنت Pascal الخاصة بي (انظر internettools المستودع) ، لذلك يدعم XPath 2.0 و Xpath 3.0 و Xquery 1.0 و Xquery 3.0 و JSONIQ و CSS المحددات واللغات الخاصة بي/اللغات الخاصة بي (مثل مطابقة النمط) وإذا تمكنت من تجميع هذا المشروع ، يمكنك تجميع Xidel.
مثال بسيط لإرجاع عناوين جميع الصفحات المرتبطة ببعض صفحة البدء:
xidel http://example.org --follow //a --extract //title
أو أبسط
xidel http://example.org -f //a -e //title
يمكن اختيار اللغة بشكل صريح. على سبيل المثال
xidel input.html --css 'a'
xidel input.html --xpath '//a/@href'
xidel input.html --xquery 'for $var in //a order by $var return $var'
إرجاع جميع الروابط ، الهدف URI لكل رابط أو نص جميع الروابط أبجديًا.
هناك المزيد من الأمثلة على الصفحة أعلاه مع الثنائيات ، Github Wiki وفي أمثلة الدليل.
يمكنك تجميعه عن طريق الاتصال build.sh وتثبيته عن طريق استدعاء build.sh -t . بدلاً من ذلك ، يمكنك تجميعها مع Lazarus IDE.
يمكنك استدعاء الأوامر من البرنامج النصي .travis.yml لتنزيل التبعيات.