この記事では、JAVAの指定されたHTMLタグを取得し、正規表現に基づいて属性値を指定する方法について説明します。次のように、参照のために共有してください。
時々、そのような要件があるかもしれません。 HTMLページから指定されたタグの指定された属性値を取得することは、サードパーティライブラリの解析を介して取得できますが、これは比較的面倒です!
正規表現を使用すると、簡単になります。コードは次のとおりです。
パッケージcom.mmq.regex; import java.util.arraylist; import java.util.list; import java.util.regex.matcher; import java.util.regex.pattern;/** * @use指定されたhtmlタグ * @projectnawnama com.mmq.regex.matchhtmlementattrvalue.java* @jdk 1.6.0* @version 1.0* /public class matchhtmlementattrvalue { /***指定されたhtmlタグの指定された属性の値を取得します* @param属性* @param属性* @param属性* @param属性値リスト*/ public static list <string> match(string source、string element、string attr){list <string> result = new arrayList <string>(); string reg = "<" +要素 + "[^<>]*?// s" + attr + "= ['/"]?(。*?)['/"]?(// s。*?)?>"; matcher m = pattern.compile(reg).matcher(source); while(m.find()){string r = m.group(1); result.add(r); } return result; } public static void main(string [] args){string source = "<a title = china sports news href = ''> aaa </a> <a title = 'beijing daily' href = ''> bbb </a>";リスト<文字列> list = match(source、 "a"、 "title"); System.out.println(list); }}PS:参照用の2つの非常に便利な正規表現ツールを次に示します。
JavaScript正規表現オンラインテストツール:
http://tools.vevb.com/regex/javascript
正規表現オンライン生成ツール:
http://tools.vevb.com/regex/create_reg
この記事がみんなのJavaプログラミングに役立つことを願っています。