เกี่ยวกับความสัมพันธ์ระหว่าง Unicode และ UTF คุณสามารถจำได้ว่า: Unicode เป็นองค์กรการเข้ารหัสข้อมูลจำเพาะการเข้ารหัสและหมายถึง UTF-16 ใน Java; ในเครือข่าย
การคัดลอกรหัสมีดังนี้:
โมฆะคงที่สาธารณะหลัก (String [] args) โยน unsupportencodingexception {
StringUtil.str2all ("0 คำอธิบายโมเดลผลิตภัณฑ์");
StringUtil.str4all ("30000900A74EC1548B57F753CF63F08F");
-
-
* พยายามเข้ารหัสสตริงตัวเลขเลขฐานสิบหกในรูปแบบการเข้ารหัสทั้งหมด
-
* @param hexstr
* @throws unsupportencodingexception
-
โมฆะคงที่สาธารณะ str4all (String USTR) พ่นไม่ได้รับการตอบรับ unportencodingexception {
System.out.println ("+++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++ +++++++++ ");
ไบต์ [] bs = ไบต์ใหม่ [USTR.Length ()/2];
สำหรับ (int i = 0; i <bs.length; i ++) {
bs [i] = (byte) integer.parseint (USTR.SUBSTRING (I*2, I*2+2), 16);
-
System.out.println (สตริงใหม่ (BS, "UTF-8"));
// 16
System.out.println (สตริงใหม่ (BS, "UTF-16"));
System.out.println (สตริงใหม่ (BS, "UTF-16LE"));
System.out.println (สตริงใหม่ (BS, "X-UTF-16LE-BOM"));
System.out.println (สตริงใหม่ (BS, "UTF-16BE"));
//system.out.println( ใหม่ (BS, "X-UTF-16BE-BOM"));
// 32
System.out.println (สตริงใหม่ (BS, "UTF-32"));
System.out.println (สตริงใหม่ (BS, "UTF-32LE"));
System.out.println (สตริงใหม่ (BS, "X-UTF-32LE-BOM"));
System.out.println (สตริงใหม่ (BS, "UTF-32BE"));
System.out.println (สตริงใหม่ (BS, "X-UTF-32LE-BOM"));
-
-
* แสดงรายการสตริงตัวเลขเลขฐานสิบหกที่ถอดรหัสทั้งหมดที่สอดคล้องกับการเข้ารหัส
-
* @param USTR
* @throws unsupportencodingexception
-
โมฆะคงที่สาธารณะ str2all (String USTR) พ่นไม่ได้รับการตอบรับที่ไม่ได้รับการยอมรับ {
System.out.println ("+++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++ +++++++++ ");
ไบต์ [] bs = ไบต์ใหม่ [] {};
BS = USTR.GETBYTES ("UTF-8");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
// 16
BS = USTR.GETBYTES ("UTF-16");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("UTF-16LE");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("X-UTF-16LE-BOM");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("UTF-16BE");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
// BS = USTR.GETBYTES ("X-UTF-16BE-BOM");
// 32
BS = USTR.GETBYTES ("UTF-32");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("UTF-32LE");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("X-UTF-32LE-BOM");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("UTF-32BE");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
BS = USTR.GETBYTES ("X-UTF-32LE-BOM");
สำหรับ (byte b: bs) {
System.out.print (Integer.tohexstring (B & 0xff));
-
System.out.println ();
-
คอลเลกชันชื่อการเขียนโค้ด
การคัดลอกรหัสมีดังนี้:
charset us-ascii %s
HistoricalName ASCII
# Iana นามแฝง
นามแฝง ISO-IR-6
นามแฝง ANSI_X3.4-1986
นามแฝง ISO_646.IRV: 1991
นามแฝง ASCII
นามแฝง ISO646-US
นามแฝงเรา
นามแฝง IBM367
นามแฝง cp367
นามแฝง CSASCII
นามแฝงเริ่มต้น
# นามแฝงอื่น ๆ
นามแฝง 646 # Solaris Posix locale
นามแฝง ISO_646.IRV: 1983
นามแฝง ANSI_X3.4-1968 # Linux Posix locale (Redhat)
นามแฝง ASCII7
charset utf-8 utf_8
HistoricalName UTF8
นามแฝง UTF8
นามแฝง unicode-1-1-UTF-8
charset utf-16 utf_16
HistoricalName UTF-16
นามแฝง UTF_16
นามแฝง UTF16
นามแฝง unicode
นามแฝง unicodebig
charset utf-16be utf_16be
HistoricalName unicodebiguned
นามแฝง UTF_16BE
นามแฝง ISO-10646-ICS-2
นามแฝง X-UTF-16BE
นามแฝง unicodebiguned
charset utf-16le utf_16le
HistoricalName unicodelittleunked
นามแฝง UTF_16LE
นามแฝง X-UTF-16LE
นามแฝง unicodelittleunked
Charset X-UTF-16LE-BOM UTF_16LE_BOM
HistoricalName unicodelittle
นามแฝง unicodelittle
charset utf-32 utf_32
นามแฝง UTF_32
นามแฝง UTF32
charset utf-32le utf_32le
นามแฝง UTF_32LE
นามแฝง X-UTF-32LE
charset utf-32be utf_32be
นามแฝง utf_32be
นามแฝง X-UTF-32BE
Charset X-UTF-32LE-BOM UTF_32LE_BOM
นามแฝง UTF_32LE_BOM
นามแฝง UTF-32LE-BOM
Charset X-UTF-32BE-BOM UTF_32BE_BOM
นามแฝง UTF_32BE_BOM
นามแฝง UTF-32BE-BOM
Charset ISO-8859-1 %s
HistoricalName iso8859_1
# Iana นามแฝง
นามแฝง ISO-IR-100
นามแฝง ISO_8859-1
นามแฝงละติน 1
นามแฝง L1
นามแฝง IBM819
นามแฝง CP819
นามแฝง Csisolatin1
# นามแฝงอื่น ๆ
นามแฝง 819
นามแฝง IBM-819
นามแฝง iso8859_1
นามแฝง ISO_8859-1: 1987
นามแฝง iso_8859_1
นามแฝง 8859_1
นามแฝง iso8859-1
Charset ISO-8859-2 %s
HistoricalName iso8859_2
นามแฝง iso8859_2
นามแฝง 8859_2
นามแฝง ISO-IR-101
นามแฝง ISO_8859-2
นามแฝง ISO_8859-2: 1987
นามแฝง iso8859-2
นามแฝง Latin2
นามแฝง L2
นามแฝง IBM912
นามแฝง IBM-912
นามแฝง CP912
นามแฝง 912
นามแฝง csisolatin2
Charset ISO-8859-4 %s
HistoricalName iso8859_4
นามแฝง iso8859_4
นามแฝง iso8859-4
นามแฝง 8859_4
นามแฝง ISO-IR-110
นามแฝง ISO_8859-4
นามแฝง ISO_8859-4: 1988
นามแฝง Latin4
นามแฝง L4
นามแฝง IBM914
นามแฝง IBM-914
นามแฝง CP914
นามแฝง 914
นามแฝง csisolatin4
Charset ISO-8859-5 %s
HistoricalName iso8859_5
นามแฝง iso8859_5
นามแฝง 8859_5
นามแฝง ISO-IR-144
นามแฝง ISO_8859-5
นามแฝง ISO_8859-5: 1988
นามแฝง ISO8859-5
นามแฝง Cyrillic
นามแฝง IBM915
นามแฝง IBM-915
นามแฝง CP915
นามแฝง 915
นามแฝง csisolatincyrillic
Charset ISO-8859-7 %s
HistoricalName iso8859_7
นามแฝง iso8859_7
นามแฝง 8859_7
นามแฝง ISO-IR-126
นามแฝง ISO_8859-7
นามแฝง ISO_8859-7: 1987
นามแฝง elot_928
นามแฝง ECMA-118
นามแฝงกรีก
นามแฝงภาษากรีก 8
นามแฝง csisolatingreek
นามแฝง sun_eu_greek # Solaris 7/8 ความเข้ากันได้
นามแฝง IBM813
นามแฝง IBM-813
นามแฝง 813
นามแฝง CP813
นามแฝง ISO8859-7 # SOLARIS 9 เข้ากันได้
Charset ISO-8859-9 %s
HistoricalName iso8859_9
นามแฝง iso8859_9
นามแฝง 8859_9
นามแฝง ISO-IR-148
นามแฝง ISO_8859-9
นามแฝง ISO_8859-9: 1989
นามแฝง iso8859-9
นามแฝงละติน 5
นามแฝง L5
นามแฝง IBM920
นามแฝง IBM-920
นามแฝง 920
นามแฝง CP920
นามแฝง CSISOLATIN5
Charset ISO-8859-13 %s
HistoricalName iso8859_13
นามแฝง iso8859_13
นามแฝง 8859_13
นามแฝง ISO_8859-13
นามแฝง iso8859-13
Charset ISO-8859-15 %s
HistoricalName iso8859_15
# iana นามแฝง
นามแฝง ISO_8859-15
# นามแฝงอื่น ๆ
นามแฝง 8859_15
นามแฝง iso8859_15
นามแฝง ISO8859-15
นามแฝง IBM923
นามแฝง IBM-923
นามแฝง CP923
นามแฝง 923
นามแฝงละติน 0
นามแฝงละติน 9
นามแฝง L9
นามแฝง csisolatin0
นามแฝง csisolatin9
นามแฝง iso8859_15_fdis
Charset koi8-r %s
HistoricalName koi8_r
นามแฝง koi8_r
นามแฝง Koi8
นามแฝง cskoi8r
Charset koi8-u %s
นามแฝง koi8_u
Charset windows-1250 %s
HistoricalName CP1250
นามแฝง CP1250
นามแฝง CP5346 # ยูโร IBM CCSID
Charset windows-1251 %s
HistoricalName CP1251
นามแฝง CP1251
นามแฝง CP5347 # ยูโร IBM CCSID
นามแฝง ANSI-1251 # ความเข้ากันได้ของ Solaris
Charset windows-1252 %s
HistoricalName CP1252
นามแฝง CP1252
นามแฝง CP5348 # ยูโร IBM CCSID
Charset windows-1253 %s
HistoricalName CP1253
นามแฝง CP1253
นามแฝง CP5349 # EURO IBM CCSID
Charset windows-1254 %s
HistoricalName CP1254
นามแฝง CP1254
นามแฝง CP5350 # Euro IBM CCSID
Charset windows-1257 %s
HistoricalName CP1257
นามแฝง CP1257
นามแฝง CP5353 # ยูโร IBM CCSID
Charset IBM437 %s
HistoricalName CP437
นามแฝง CP437
นามแฝง IBM-437
นามแฝง 437
นามแฝง CSPC8CODEPAGE437
นามแฝง Windows-437
Charset X-IBM737 %S
HistoricalName CP737
นามแฝง CP737
นามแฝง IBM737
นามแฝง IBM-737
นามแฝง 737
Charset IBM775 %s
HistoricalName CP775
นามแฝง CP775
นามแฝง IBM-775
นามแฝง 775
Charset IBM850 %s
HistoricalName CP850
นามแฝง CP850
นามแฝง IBM-850
นามแฝง 850
นามแฝง CSPC850 ภาษา
Charset IBM852 %s
HistoricalName CP852
นามแฝง CP852
นามแฝง IBM-852
นามแฝง 852
นามแฝง CSPCP852
Charset IBM855 %s
HistoricalName CP855
นามแฝง CP855
นามแฝง IBM-855
นามแฝง 855
นามแฝง CSPCP855
Charset IBM857 %s
HistoricalName CP857
นามแฝง CP857
นามแฝง IBM-857
นามแฝง 857
นามแฝง CSIBM857
Charset IBM00858 %s
HistoricalName CP858
นามแฝง CP858
นามแฝง CCSID00858
นามแฝง CP00858
นามแฝง 858
Charset IBM862 %s
HistoricalName CP862
นามแฝง CP862
นามแฝง IBM-862
นามแฝง 862
นามแฝง CSIBM862
นามแฝง cspc862latinhebrew
Charset IBM866 %s
HistoricalName CP866
นามแฝง CP866
นามแฝง IBM-866
นามแฝง 866
นามแฝง CSIBM866
Charset X-IBM874 %s
HistoricalName CP874
นามแฝง CP874
นามแฝง IBM874
นามแฝง IBM-874
นามแฝง 874