Die Codekopie lautet wie folgt:
Paketarbeit;
Import Java.io.BufferedReader;
importieren java.io.ioException;
importieren java.io.inputstream;
importieren java.io.inputStreamReader;
Import Java.util.Regx.Matcher;
Import Java.util.Regex.Pattern;
import org.apache.commons.httpclient.defaushttpMethodryHandler;
import org.apache.commons.httpclient.httpclient;
import org.apache.commons.httpclient.httpexception;
import org.apache.commons.httpclient.httpstatus;
import org.apache.commons.httpclient.methods.getmethod;
import org.apache.commons.httpclient.params.httpMethodparams;
öffentliche Klasse Chuanboyi {
public static void main (String [] args) {
// Todo automatisch generierte Methode Stub
StringBuffer html = new StringBuffer ();
Httpclient httppclient = new httpclient ();
// Erstellen Sie eine GET -Methode -Instanz
GetMethod getMethod = new getMethod ("// www.vevb.com");
// Verwenden Sie die vom System bereitgestellten Standard -Wiederherstellungsrichtlinie
getMethod.getParams (). setParameter (httpMethodParams.retry_handler, neuer DefaulthttpMethodryHandler ());
versuchen{
// Führen Sie die GET -Methode aus
int statuscode = httpclient.executemethod (getMethod);
if (statuscode! = httpstatus.sc_ok) {
System.out.println ("Methode ist falsch" + getMethod.getStatusline ());
}
InputStream responseBody = getMethod.getResponseBodyAssTream ();
BufferedReader Reader = New BufferedReader (neuer InputStreamReader (ResponseBody, "UTF-8");
String line = reader.readline ();
while (line! = null) {
html.Append (Zeile) .Append ("/n");
line = reader.readline ();
}
reader.close ();
// regulärer Ausdruck
String regex = "<Formular name =/" compareForm/"[// s // s]+> [// s // s]+</form>.*<Script.*>";
String regexa = "(? <= <li>) [// s // s]+? (? = </Li>)";
Muster muster = muster.comPile (regex);
Matcher M = muster.Matcher (HTML);
StringBuffer str = new StringBuffer ();
int i = 0;
while (m.find ()) {
Str.Append (M.Group ());
}
muster = muster.comPile (regexa);
M = Muster.Matcher (str);
while (m.find ()) {
Attrs (M.Group ());
i ++;
}
System.out.println ("Es gibt Summen"+i+"Daten!");
} catch (httpexception e) {
// TODO: Ausnahme behandeln
System.out.println ("Bitte überprüfen Sie Ihre bereitgestellte HTTP -Adresse!");
E. printstacktrace ();
} catch (ioException e) {
// TODO: Ausnahme behandeln
System.out.println ("Die Linie ist falsch!");
E. printstacktrace ();
} Endlich{
GetMethod.ReleasConnection (); // den Link freigeben
}
}
public static void attrs (String str) {
// Holen Sie sich die Regex der URL
String regexurl = "[az]+-[0-9]+//. Html";
// Erhalten Sie den regulären Namen des Namens
String regexname = "(? <= Title =/") [// w-// s] [^x00-xff]]+(? =/")";
// Erhalten Sie den regulären Ausdruck des Bildes
String regexpicture = "Bilder.*//. JPG";
Muster musterurl = muster.comPile (regexurl);
Muster mustername = muster.comPile (regexname);
Muster musterpicture = muster.comPile (regexpicture);
Matcher murl = musterurl.matcher (str);
Matcher mname = mustername.matcher (str);
Matcher mpicture = musterpicture.matcher (str);
if (mname.find ()) {
System.out.println ("Name:"+mname.group ());
}
if (murl.find ()) {
System.out.println ("Link:"+murl.group ());
}
if (mpicture.find ()) {
System.out.println ("Bild:"+mpicture.group ());
}
}
}