Ocasionalmente, personagens como "nos dados são os seguintes
Comece com &#, com uma série de números no meio, terminando com;
Comece com &, com uma série de caracteres no meio, terminando com;
Por exemplo, o mais comum ou equivalente
Quando um navegador encontra esses personagens de fuga, ele escapa de volta, mas como identificá -los através do código? org.apache.commons.lang.stringescapeutils.unescapehtml fornece uma boa explicação
No primeiro caso acima, o meio é um número e o número (unicode) é convertido em char
Ao encontrar a segunda situação, existem personagens no meio, para que você possa procurar apenas a tabela de mapeamento. Encontre os números correspondentes de caracteres da tabela de mapeamento e converta -os em char. Olhe para o código e você o verá rapidamente.
Veja como o HTML40 é definido
Copie o código