Cet article décrit la méthode de Java à obtenir les balises HTML spécifiées et à spécifier des valeurs d'attribut basées sur des expressions régulières. Partagez-le pour votre référence, comme suit:
Parfois, il peut y avoir une telle exigence. L'obtention de la valeur d'attribut spécifiée de la balise spécifiée à partir de la page HTML peut être obtenue via l'analyse de bibliothèque tierce, mais cela est relativement gênant!
Si vous utilisez des expressions régulières, cela devient simple. Le code est le suivant:
package com.mmq.regex; importer java.util.arraylist; import java.util.list; import java.util.regex.matcher; import java.util.regex.pattern; / ** * @Use Obtenez la valeur de l'attribut spécifié du tag html spécifié * @projectname qui com.mmq.regex.matchhtmlementattrvalue.java * @jdk 1.6.0 * @version 1.0 * / classe publique MatchhtmlementAtArtrvalue {/ ** * Obtenez la valeur de l'attribut spécifié de la balise HTML spécifiée * @param @rerurn source Source Text to tag Name Nom du balise * @Return Attribute Value List * / public static list <string> match (String Source, String Element, String at at) {list <string> result = new ArrayList <string> (); String reg = "<" + élément + "[^ <>] *? // S" + attRAT + "= ['/"]? (. *?) [' / "]? (// s. *?)?>"; Matcher m = motive.compile (reg) .matcher (source); while (m.find ()) {String r = M.Group (1); résultat.add (r); } Retour Résultat; } public static void main (string [] args) {String source = "<a title = china sportive actual href = ''> aaa </a> <a title = 'beijing quotidien' href = ''> bbb </a>"; List <string> list = correspond (source, "a", "title"); System.out.println (liste); }}PS: Voici deux outils d'expression régulière très pratiques pour votre référence:
Tool de test en ligne d'expression régulière JavaScript:
http://tools.vevb.com/regex/javascript
Outil de génération en ligne d'expression régulière:
http://tools.vevb.com/regex/create_reg
J'espère que cet article sera utile à la programmation Java de tous.