/*from:http://blog.joycode.com/hopeq/archive/2005/09/26/64146.aspx*/
웹 프로젝트가 있습니다. 데이터베이스에서 가져온 프로필 데이터는 모두 중국어, 한국 및 일본어와 혼합 될 수 있습니다. 물론 프로젝트의 코딩이 UTF-8을 사용하는 경우 문제가 없지만이 프로젝트는 기존 프로그램에 영향을 미치지 않기 위해서는 UTF-8로 변경할 수 없습니다. 이 페이지에서만 이동하십시오.
연구 후,이 문제는 HTML 엔티티 방법에 의해 해결 될 수 있음이 밝혀졌습니다.
HTML 엔티티의 경우 다음을 참조하십시오.
HTML 4의 문자 엔티티 참조
HTML 문서 교체성
테스트 코드 :
바이트 [] bcomments = encoding.utf8.getBytes ( "ich is ブ ル ???? Chinese");
char [] ccomments = encoding.utf8.getchars (bcomments);
StringBuilder charBuilder = new StringBuilder ();
foreach (ccomments의 char c)
{{
if (c> '/u0800'))
{{
charBuilder.Append ( "&#");
charBuilder.Append ((int) c);
}
또 다른
{{
charBuilder.Append (c);
}
}
response.write (charBuilder.toString ());
이 코드의 역할은 하드 코딩을 통해 모든 중국어, 한국 및 일본 문자를 HTML 엔티티에 출력하는 것입니다. HTML 엔티티는 리폰 코딩 및 페이지 코딩 세트의 영향을받지 않습니다.
설명 :
위의 /U0800은 중국어, 한국 및 일본 문자입니다.
중국어의 범위 :/u4e00-/u9fa5, 일본어/u0800-/u4e00, 한국은/u9fa5 이상입니다.
이 방법은 소규모 문제를 해결하는 것입니다.