/*From:http://blog.joycode.com/hopeq/archive/2005/09/26/64146.aspx*/
Hay un proyecto web. Por supuesto, si la codificación del proyecto usa UTF-8, no habrá problema, pero este proyecto es un proyecto antiguo. Solo muévase en esta página cerebro.
Después de la investigación, se encuentra que este problema puede resolverse mediante el método de entidad HTML.
Para entidades HTML, consulte:
Referencias de la entidad del personaje en HTML 4
reemplazo de documentos HTML
Código de prueba:
byte [] bcomments = encoding.utf8.getBytes ("ich es ブ ル ル ル ル ル ル ル ル");
char [] ccomments = encoding.utf8.getChars (bcomments);
StringBuilder charbuilder = new StringBuilder ();
Foreach (char c en ccomments)
{{
if (c> '/u0800'))
{{
charbuilder.append ("&#");
charbuilder.append ((int) c);
}
demás
{{
Charbuilder.append (c);
}
}
Respuesta.Write (CharBuilder.ToString ());
El papel de este código es generar todos los caracteres chinos, coreanos y japoneses en entidades HTML a través de la codificación dura. La entidad HTML no se ve afectada por el conjunto de codificación y codificación de página.
ilustrar:
/U0800 arriba son caracteres chinos, coreanos y japoneses.
Alcance de chino:/u4e00-/u9fa5, japonés en/u0800-/u4e00, y coreano está por encima/u9fa5.
Este método es solo para resolver el pequeño problema a escala.