/// <summary>
/// html标记
/// </summary>
/// <param name = "strhtml">包括HTML</param>
/// <Returns>已经去除后的文字</returns>
public static string striphtml(string strhtml)
{
string [] aryreg = {
@"<スクリプト[^>]*?>。*?</script>"、
@"<(/// s*)?
@"([/r/n])[/s]+"、
@"&(quot |#34);"、
@"&(amp |#38);"、
@"&(lt |#60);"、
@"&(gt |#62);"
@"&(nbsp |#160);"
@"&(iexcl |#161);"、
@"&(cent |#162);"、
@"&(pound |#163);"、
@"&(copy |#169);"、
@"&#(/d+);"、
@" - >"、
@"<! - 。*/n"
};
string [] aryrep = {
""、
""、
""、
"/" "、
「&」、
"<"、
「>」、
""、
"/xa1"、// chr(161)、
"/xa2"、// chr(162)、
"/xa3"、// chr(163)、
"/xa9"、// chr(169)、
""、
「/r/n」、
""
};
文字列newReg = aryreg [0];
string stroutput = strhtml;
for(int i = 0; i <aryreg.length; i ++)
{
Regex regex = new regex(aryreg [i]、regexoptions.ignorecase);
stroutput = regex.replace(stroutput、aryrep [i]);
}
stroutput.replace( "<"、 "");
stroutput.replace( ">"、 "");
stroutput.replace( "/r/n"、 "");
stroutputを返します。
}