유니 코드와 UTF의 관계와 관련하여, 당신은 단순히 기억할 수 있습니다. 유니 코드는 코딩 조직이며, 코딩 사양이며, UTF는 유니 코드 인코딩의 변환 변환 형식을 전송하고 저장할 수 있습니다. 네트워크에서 미디어 요약 및 스토리지에는 8, 16, 32와 같은 여러 형식의 UTF가 있으며 LE와 TE의 차이가 다음 프로세스에 10 개의 유니 코드 인코딩 형식이있을 때만 있습니다.
코드 사본은 다음과 같습니다.
public static void main (string [] args)은 UnsupportedEncodingException {
StringUtil.str2all ( "0 제품 모델 설명");
StringUtil.str4all ( "30000900A74EC1548B57F753CF63F08F");
}
/**
* 모든 인코딩 형식으로 16 진 숫자 문자열 인코딩을 시도하십시오.
*
* @param hexstr
* @throws UnsupportedEncodingException
*/
public static void str4all (String USTR)은 UnsupportedEncodingException {
System.out.println("+++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++ +++++++ ");
바이트 [] bs = new Byte [ustr.length ()/2];
for (int i = 0; i <bs.length; i ++) {
bs [i] = (바이트) integer.parseint (ustr.substring (i*2, i*2+2), 16);
}
System.out.println (새 문자열 (BS, "UTF-8"));
// 16
System.out.println (bs, "utf-16"); // 유니 코드와 동일합니다
System.out.println (새 문자열 (BS, "UTF-16LE"));
System.out.println (새 문자열 (bs, "x-utf-16le-bom"));
System.out.println (새 문자열 (BS, "UTF-16BE"));
//system.out.println (bs, "x-utf-16be-bom");
// 32
System.out.println (새 문자열 (BS, "UTF-32");
System.out.println (새 문자열 (BS, "UTF-32LE"));
System.out.println (새 문자열 (bs, "x-utf-32le-bom"));
System.out.println (새 문자열 (bs, "utf-32be");
System.out.println (새 문자열 (bs, "x-utf-32le-bom"));
}
/**
* 인코딩에 해당하는 모든 디코딩 된 16 진수 숫자 문자열 나열
*
* @param ustr
* @throws UnsupportedEncodingException
*/
public static void str2all (String USTR)은 UnsupportedEncodingException {
System.out.println("+++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++ +++++++ ");
바이트 [] bs = new Byte [] {};
bs = ustr.getBytes ( "UTF-8");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
// 16
bs = ustr.getBytes ( "UTF-16");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "utf-16le");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "x-utf-16le-bom");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "UTF-16BE");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
// bs = ustr.getBytes ( "x-utf-16be-bom");
// 32
bs = ustr.getBytes ( "UTF-32");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "UTF-32LE");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "x-utf-32le-bom");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "UTF-32BE");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getBytes ( "x-utf-32le-bom");
for (byte b : bs) {
System.out.print (Integer.tohexstring (b & 0xff));
}
System.out.println ();
}
코딩 이름 수집
코드 사본은 다음과 같습니다.
charset us-ascii %s
HistoricalName ASCII
# Iana 별칭
별칭 ISO-IR-6
별칭 ansi_x3.4-1986
별칭 ISO_646.IRV : 1991
별칭 ascii
별칭 ISO646-US
우리를 별명
별칭 IBM367
별칭 CP367
별칭 csascii
별칭 기본값
# 기타 별칭
별칭 646 # Solaris Posix 로케일
별칭 ISO_646.IRV : 1983
alias ansi_x3.4-1968 # Linux Posix Locale (redhat)
별칭 ascii7
Charset UTF-8 UTF_8
HistoricalName UTF8
별칭 UTF8
별칭 유니 코드 -1-1-UTF-8
Charset UTF-16 UTF_16
HistoricalName UTF-16
별칭 UTF_16
별칭 UTF16
별명 유니 코드
별칭 유니 코드 비그
Charset UTF-16BE UTF_16BE
HistoricalName UnicodeBigunMarked
별칭 UTF_16BE
별칭 ISO-10646-UCS-2
별칭 X-UTF-16BE
별명 유니 코드 비가 마크
Charset UTF-16LE UTF_16LE
HistoricalName UnicodelittleUnMarked
별칭 UTF_16LE
별칭 X-UTF-16LE
별명 unicodelittleUnmarked
charset x-utf-16le-bom utf_16le_bom
HistoricalName Unicodelittle
별명 유니 코드 리틀
Charset UTF-32 UTF_32
별칭 UTF_32
별칭 UTF32
Charset UTF-32LE UTF_32LE
별칭 UTF_32LE
별칭 X-UTF-32LE
Charset UTF-32BE UTF_32BE
별칭 UTF_32BE
별칭 x-utf-32be
Charset X-UTF-32-BOM UTF_32LE_BOM
별칭 UTF_32LE_BOM
별칭 UTF-32LE-BOM
Charset X-UTF-32BE-BOM UTF_32BE_BOM
별칭 UTF_32BE_BOM
별칭 UTF-32BE-BOM
숯불 ISO-8859-1 %s
HistoricalName ISO8859_1
# Iana 별칭
별칭 ISO-IR-100
별칭 ISO_8859-1
별칭 latin1
별칭 L1
별칭 IBM819
별칭 CP819
별칭 csisoLatin1
# 기타 별칭
별칭 819
별칭 IBM-819
별칭 ISO8859_1
별칭 ISO_8859-1 : 1987
별칭 ISO_8859_1
별칭 8859_1
별칭 ISO8859-1
Charset ISO-8859-2 %s
HistoricalName ISO8859_2
별칭 ISO8859_2
별칭 8859_2
별칭 ISO-IR-101
별칭 ISO_8859-2
별칭 ISO_8859-2 : 1987
별칭 ISO8859-2
별칭 latin2
별칭 L2
별칭 IBM912
별칭 IBM-912
별칭 CP912
별칭 912
별칭 csisoLatin2
Charset ISO-8859-4 %s
HistoricalName ISO8859_4
별칭 ISO8859_4
별칭 ISO8859-4
별칭 8859_4
별칭 ISO-IR-110
별칭 ISO_8859-4
별칭 ISO_8859-4 : 1988
별명 latin4
별칭 L4
별칭 IBM914
별칭 IBM-914
별칭 CP914
별칭 914
별칭 csisoLatin4
Charset ISO-8859-5 %s
HistoricalName ISO8859_5
별칭 ISO8859_5
별칭 8859_5
별칭 ISO-IR-144
별칭 ISO_8859-5
별칭 ISO_8859-5 : 1988
별칭 ISO8859-5
별명 키릴
별칭 IBM915
별칭 IBM-915
별칭 CP915
별칭 915
별칭 csisolatincyrillic
Charset ISO-8859-7 %s
HistoricalName ISO8859_7
별칭 ISO8859_7
별칭 8859_7
별칭 ISO-IR-126
별칭 ISO_8859-7
별칭 ISO_8859-7 : 1987
별칭 ELOT_928
별칭 ECMA-118
별명 그리스어
별명 그리스어 8
별칭 csisolatingek
별칭 Sun_EU_GREEK # SOLARIS 7/8 호환성
별칭 IBM813
별칭 IBM-813
별칭 813
별칭 CP813
별명 ISO8859-7 # Solaris 9 호환성
숯불 ISO-8859-9 %s
HistoricalName ISO8859_9
별칭 ISO8859_9
별칭 8859_9
별칭 ISO-IR-148
별칭 ISO_8859-9
별칭 ISO_8859-9 : 1989
별칭 ISO8859-9
별명 latin5
별칭 L5
별칭 IBM920
별칭 IBM-920
별칭 920
별칭 CP920
별칭 csisoLatin5
Charset ISO-8859-13 %s
HistoricalName ISO8859_13
별칭 ISO8859_13
별칭 8859_13
별칭 ISO_8859-13
별칭 ISO8859-13
Charset ISO-8859-15 %s
HistoricalName ISO8859_15
# IANA 별칭
별칭 ISO_8859-15
# 기타 별칭
별칭 8859_15
별칭 ISO8859_15
별칭 ISO8859-15
별칭 IBM923
별칭 IBM-923
별칭 CP923
별칭 923
별명 Latin0
별칭 latin9
별칭 L9
별칭 csisoLatin0
별칭 csisolatin9
별칭 ISO8859_15_FDIS
Charset koi8-r %s
HistoricalName Koi8_r
별칭 koi8_r
별칭 koi8
별칭 CSKOI8R
Charset koi8-U %s
별칭 koi8_u
Charset Windows-1250 %s
HistoricalName CP1250
별칭 CP1250
별칭 CP5346 # 유로 IBM CCSID
Charset Windows-1251 %s
HistoricalName CP1251
별칭 CP1251
별칭 CP5347 # 유로 IBM CCSID
별명 ANSI-1251 # Solaris 호환성
Charset Windows-1252 %s
HistoricalName CP1252
별칭 CP1252
별칭 CP5348 # 유로 IBM CCSID
Charset Windows-1253 %s
HistoricalName CP1253
별칭 CP1253
별칭 CP5349 # EURO IBM CCSID
Charset Windows-1254 %s
HistoricalName CP1254
별칭 CP1254
별칭 CP5350 # EURO IBM CCSID
Charset Windows-1257 %s
HistoricalName CP1257
별칭 CP1257
별칭 CP5353 # EURO IBM CCSID
숯불 IBM437 %s
HistoricalName CP437
별칭 CP437
별칭 IBM-437
별칭 437
별칭 cspc8codepage437
별명 Windows-437
Charset X-IBM737 %s
HistoricalName CP737
별칭 CP737
별칭 IBM737
별칭 IBM-737
별칭 737
Charset IBM775 %s
HistoricalName CP775
별칭 CP775
별칭 IBM-775
별칭 775
Charset IBM850 %s
HistoricalName CP850
별칭 CP850
별칭 IBM-850
별칭 850
별칭 CSPC850 -Multubular
숯불 IBM852 %s
HistoricalName CP852
별칭 CP852
별칭 IBM-852
별칭 852
별칭 CSPCP852
숯불 IBM855 %s
HistoricalName CP855
별칭 CP855
별칭 IBM-855
별칭 855
별칭 CSPCP855
숯불 IBM857 %s
HistoricalName CP857
별칭 CP857
별칭 IBM-857
별칭 857
별칭 CSIBM857
Charset IBM00858 %s
HistoricalName CP858
별칭 CP858
별칭 CCSID00858
별칭 CP00858
별칭 858
숯불 IBM862 %s
HistoricalName CP862
별칭 CP862
별칭 IBM-862
별칭 862
별칭 CSIBM862
별칭 CSPC862LATINHEBREW
숯불 IBM866 %s
HistoricalName CP866
별칭 CP866
별칭 IBM-866
별칭 866
별칭 CSIBM866
숯불 X-IBM874 %s
HistoricalName CP874
별칭 CP874
별칭 IBM874
별칭 IBM-874
별칭 874