時折、「データ内のような文字は次のとおりです
&#から始めて、中央に一連の数字があり、終わります。
中央に一連のキャラクターを使用して、&で終わります。
たとえば、最も一般的または同等です
ブラウザがこれらのエスケープキャラクターに遭遇すると、それは逃げますが、コードを介してそれらを識別する方法は? org.apache.commons.lang.stringescapeutils.unescapehtmlは良い説明を提供します
上記の最初のケースでは、中央は数字であり、数(Unicode)がCharに変換されます
2番目の状況に遭遇すると、中央に文字がありますので、マッピングテーブルのみを調べることができます。マッピングテーブルから対応する数の文字を見つけて、それらをcharに変換します。コードを見れば、一目で表示されます。
HTML40がどのように定義されているかを参照してください
コードをコピーします