xidel
Xidel 0.9.8
Xidel是使用CSS选择器,XPATH/XQUERY 3.0从HTML/XML页面下载和提取数据的命令行工具,并使用JSONIQ查询JSON文件或API(例如REST)。
Windows,Linux和Mac有无依赖性二进制文件。
它是围绕我的Pascal Internet工具(请参阅Repository Intertetools)的包装器,因此它支持XPath 2.0,Xpath 3.0,Xquery 1.0,Xquery 1.0,Xquery 3.0,JSONIQ,CSS选择器和我自己的扩展/语言/语言(例如模式匹配),如果您可以编译该项目,则可以编译该项目,可以编译Xidel。
一个简单的示例来返回由某些启动页面链接的所有页面的标题:
xidel http://example.org --follow //a --extract //title
或更简单
xidel http://example.org -f //a -e //title
可以明确选择该语言。例如
xidel input.html --css 'a'
xidel input.html --xpath '//a/@href'
xidel input.html --xquery 'for $var in //a order by $var return $var'
返回所有链接,每个链接的目标URI或字母顺序的所有链接的文本。
上一页上有更多示例,其中包括二进制文件,github wiki和目录示例。
您可以通过调用build.sh并通过调用build.sh -t进行安装来编译它。另外,您可以用Lazarus IDE进行编译。
您可以从.travis.yml脚本调用命令以下载依赖项。