Este artículo describe el método de Java para obtener las etiquetas HTML especificadas y especificar valores de atributos basados en expresiones regulares. Compártelo para su referencia, como sigue:
A veces puede haber tal requisito. Obtener el valor de atributo especificado de la etiqueta especificada de la página HTML se puede obtener a través del análisis de la biblioteca de terceros, ¡pero esto es relativamente problemático!
Si usa expresiones regulares, se vuelve simple. El código es el siguiente:
paquete com.mmmq.regex; import java.util.ArrayList; import java.util.list; import java.util.regex.matcher; import java.util.util.sregex.pattern;/** * @use com.mmq.regex.matchhtmlelementAttrvalue.java* @jdk 1.6.0* @version 1.0* /public class MatchHtmLelementAttrValue { /*** Obtenga el valor del atributo especificado de la etiqueta HTML* @param Source Texting Text To Mate* @Param Element Name* @param Atributo Atributo* Atributo de atributo HTML de la etiqueta @param. @Return Atribute Value List*/ public static List <String> Match (String Source, String Element, String Attr) {List <String> Result = New ArrayList <String> (); Cadena reg = "<" + elemento + "[^<>]*? // s" + attr + "= ['/"]? (.*?) ['/"]? (// s.*?)?>"; Matcher M = Pattern.compile (reg) .Matcher (fuente); while (m.find ()) {string r = m.group (1); resultado.Add (r); } resultado de retorno; } public static void main (string [] args) {String source = "<a title = China Sports News href = ''> aaa </a> <a title = 'beijing diario' href = ''> bbb </a>"; List <String> list = Match (fuente, "A", "Título"); System.out.println (lista); }}PD: Aquí hay dos herramientas de expresión regulares muy convenientes para su referencia:
JavaScript Herramienta de prueba en línea de expresión regular de JavaScript:
http://tools.vevb.com/regex/javascript
Herramienta de generación en línea de expresión regular:
http://tools.vevb.com/regex/create_reg
Espero que este artículo sea útil para la programación Java de todos.