Что касается отношений между Unicode и UTF, вы можете просто помнить: Unicode является кодирующей организацией, спецификацией кодирования и относится к UTF-16 в Java; хорошо в сети.
Кода -копия выглядит следующим образом:
public static void main (string [] args) бросает UnsupportedEncodingException {
StringUtil.str2all ("0 Описание модели продукта");
StringUtil.str4all ("30000900A74EC1548B57F753CF63F08F");
}
/**
* Попробуйте кодировать шестнадцатеричные числовые строки во всех форматах кодирования
*
* @param hexstr
* @Throws UnsUpportEncodingException
*/
public static void str4all (string ustr) бросает UnsupportedEncodingException {
System.out.println ("++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++++ ++++++++ ");
byte [] bs = new byte [ustr.length ()/2];
для (int i = 0; i <bs.length; i ++) {
bs [i] = (byte) integer.parseint (ustr.substring (i*2, i*2+2), 16);
}
System.out.println (новая строка (BS, "UTF-8"));
// 16
System.out.println (New String (BS, "UTF-16"));
System.out.println (New String (BS, "UTF-16LE"));
System.out.println (New String (BS, "x-UTF-16LE-BOM"));
System.out.println (New String (BS, "UTF-16BE"));
//System.out.println(new String (bs, "x-utf-16be-bom"));
// 32
System.out.println (New String (BS, "UTF-32"));
System.out.println (New String (BS, "UTF-32LE"));
System.out.println (новая строка (BS, "x-utf-32le-bom"));
System.out.println (New String (BS, "UTF-32BE"));
System.out.println (новая строка (BS, "x-utf-32le-bom"));
}
/**
* Перечислите все декодированные шестнадцатеричные числовые строки, соответствующие кодированию
*
* @param usstr
* @Throws UnsUpportEncodingException
*/
public static void str2all (string ustr) бросает UnsupportedEncodingException {
System.out.println ("++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++++ ++++++++ ");
byte [] bs = new byte [] {};
bs = ustr.getbytes ("utf-8");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
// 16
bs = ustr.getbytes ("UTF-16");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("utf-16le");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("x-utf-16le-bom");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("utf-16be");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
// bs = ustr.getbytes ("x-utf-16be-bom");
// 32
bs = ustr.getbytes ("UTF-32");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("utf-32le");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("x-utf-32le-bom");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("utf-32be");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
bs = ustr.getbytes ("x-utf-32le-bom");
для (Byte B: BS) {
System.out.print (integer.tohexstring (b & 0xff));
}
System.out.println ();
}
Коллекция кодирования
Кода -копия выглядит следующим образом:
charset us-assii %s
Историческое имя ASCII
# Иана псевдонимов
псевдоним iso-IR-6
псевдоним ansi_x3.4-1986
псевдоним iso_646.irv: 1991
псевдоним ascii
псевдоним iso646-us
псевдоним нас
псевдоним IBM367
псевдоним CP367
псевдоним csascii
псевдоним по умолчанию
# Другие псевдонимы
псевдоним 646 # solaris posix locale
псевдоним iso_646.irv: 1983
псевдоним ansi_x3.4-1968 # linux posix locale (redhat)
псевдоним ascii7
Charset UTF-8 UTF_8
Историческое имя UTF8
псевдоним UTF8
псевдоним Unicode-1-1-UTF-8
Charset UTF-16 UTF_16
Историческое имя UTF-16
псевдоним UTF_16
псевдоним UTF16
псевдоним Unicode
псевдоним Unicodebig
charset utf-16be utf_16be
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ UNICODEBIGUNMARDED
псевдоним utf_16be
псевдоним ISO-10646-UCS-2
псевдоним X-UTF-16BE
псевдоним Unicodebigunmarked
Charset UTF-16LE UTF_16LE
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ UNICODELITTLEUNMARKED
псевдоним utf_16le
псевдоним X-UTF-16LE
псевдоним Unicodelittleunmarked
charset x-utf-16le-bom utf_16le_bom
Историческое имя Unicodelittle
псевдоним Unicodelittle
Charset UTF-32 UTF_32
псевдоним UTF_32
псевдоним UTF32
Charset UTF-32LE UTF_32LE
псевдоним utf_32le
псевдоним X-UTF-32LE
Charset UTF-32BE UTF_32BE
псевдоним utf_32be
псевдоним X-UTF-32BE
charset x-utf-32le-bom utf_32le_bom
псевдоним utf_32le_bom
псевдоним UTF-32LE-BOM
charset x-utf-32be-bom utf_32be_bom
псевдоним utf_32be_bom
псевдоним UTF-32BE-BOM
charset iso-8859-1 %s
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_1
# Иана псевдонимов
псевдоним iso-IR-100
псевдоним iso_8859-1
псевдоним латин1
псевдоним L1
псевдоним IBM819
псевдоним CP819
псевдоним csisolatin1
# Другие псевдонимы
псевдоним 819
псевдоним IBM-819
псевдоним iso8859_1
псевдоним iso_8859-1: 1987
псевдоним iso_8859_1
псевдоним 8859_1
псевдоним iso8859-1
charset iso-8859-2 %s
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_2
псевдоним iso8859_2
псевдоним 8859_2
псевдоним iso-IR-101
псевдоним iso_8859-2
псевдоним iso_8859-2: 1987
псевдоним iso8859-2
псевдоним латин2
псевдоним L2
псевдоним IBM912
псевдоним IBM-912
псевдоним CP912
псевдоним 912
псевдоним csisolatin2
charset iso-8859-4 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_4
псевдоним iso8859_4
псевдоним iso8859-4
псевдоним 8859_4
псевдоним iso-IR-110
псевдоним iso_8859-4
псевдоним iso_8859-4: 1988
псевдоним Латин4
псевдоним L4
псевдоним IBM914
псевдоним IBM-914
псевдоним CP914
псевдоним 914
псевдоним csisolatin4
charset iso-8859-5 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_5
псевдоним iso8859_5
псевдоним 8859_5
псевдоним iso-IR-144
псевдоним iso_8859-5
псевдоним iso_8859-5: 1988
псевдоним iso8859-5
псевдоним Кириллик
псевдоним IBM915
псевдоним IBM-915
псевдоним CP915
псевдоним 915
псевдоним csisolancyrillic
charset iso-8859-7 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_7
псевдоним iso8859_7
псевдоним 8859_7
псевдоним iso-IR-126
псевдоним iso_8859-7
псевдоним iso_8859-7: 1987
псевдоним elot_928
псевдоним ECMA-118
псевдоним греческий
псевдоним греческий 8
псевдоним csisolationreek
псевдоним sun_eu_greek # solaris 7/8 совместимость
псевдоним IBM813
псевдоним IBM-813
псевдоним 813
псевдоним CP813
псевдоним ISO8859-7 # Совместимость Solaris 9
charset iso-8859-9 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_9
псевдоним iso8859_9
псевдоним 8859_9
псевдоним iso-IR-148
псевдоним iso_8859-9
псевдоним iso_8859-9: 1989
псевдоним iso8859-9
псевдоним латин55
псевдоним L5
псевдоним IBM920
псевдоним IBM-920
псевдоним 920
псевдоним CP920
псевдоним csisolatin5
charset iso-8859-13 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_13
псевдоним iso8859_13
псевдоним 8859_13
псевдоним iso_8859-13
псевдоним iso8859-13
charset iso-8859-15 %с
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ ISO8859_15
# Яна псевдоним
псевдоним iso_8859-15
# Другие псевдонимы
псевдоним 8859_15
псевдоним iso8859_15
псевдоним iso8859-15
псевдоним IBM923
псевдоним IBM-923
псевдоним CP923
псевдоним 923
псевдоним Латин0
псевдоним Латин9
псевдоним L9
псевдоним csisolatin0
псевдоним csisolatin9
псевдоним iso8859_15_fdis
Charset Koi8-R %s
ИСТОРИЧЕСКОЕ НАМЕЧАНИЕ KOI8_R
псевдоним koi8_r
псевдоним koi8
псевдоним CSKOI8R
Charset Koi8-u %s
псевдоним koi8_u
Charset Windows-1250 %с
Историческое имя CP1250
псевдоним CP1250
псевдоним CP5346 # Euro IBM CCSID
Charset Windows-1251 %с
Историческое имя CP1251
псевдоним CP1251
псевдоним CP5347 # Euro IBM CCSID
псевдоним ANSI-1251 # Совместимость Solaris
Charset Windows-1252 %с
Историческое имя CP1252
псевдоним CP1252
псевдоним CP5348 # Euro IBM CCSID
Charset Windows-1253 %с
Историческое имя CP1253
псевдоним CP1253
псевдоним CP5349 # Euro IBM CCSID
Charset Windows-1254 %с
Историческое имя CP1254
псевдоним CP1254
псевдоним CP5350 # Euro IBM CCSID
Charset Windows-1257 %с
Историческое имя CP1257
псевдоним CP1257
псевдоним CP5353 # Euro IBM CCSID
Charset IBM437 %с
Историческое имя CP437
псевдоним CP437
псевдоним IBM-437
псевдоним 437
псевдоним CSPC8CodePage437
псевдоним Windows-437
Charset X-IBM737 %с
Историческое имя CP737
псевдоним CP737
псевдоним IBM737
псевдоним IBM-737
псевдоним 737
Charset IBM775 %с
Историческое имя CP775
псевдоним CP775
псевдоним IBM-775
псевдоним 775
Charset IBM850 %с
Историческое имя CP850
псевдоним CP850
псевдоним IBM-850
псевдоним 850
псевдоним CSPC850Multingual
Charset IBM852 %с
Историческое имя CP852
псевдоним CP852
псевдоним IBM-852
псевдоним 852
псевдоним CSPCP852
Charset IBM855 %с
Историческое имя CP855
псевдоним CP855
псевдоним IBM-855
псевдоним 855
псевдоним CSPCP855
Charset IBM857 %с
Историческое имя CP857
псевдоним CP857
псевдоним IBM-857
псевдоним 857
псевдоним CSIBM857
Charset IBM00858 %с
Историческое имя CP858
псевдоним CP858
псевдоним CCSID00858
псевдоним CP00858
псевдоним 858
Charset IBM862 %с
Историческое имя CP862
псевдоним CP862
псевдоним IBM-862
псевдоним 862
псевдоним CSIBM862
псевдоним CSPC862Latinhebrew
Charset IBM866 %с
Историческое имя CP866
псевдоним CP866
псевдоним IBM-866
псевдоним 866
псевдоним CSIBM866
charset x-ibm874 %s
Историческое имя CP874
псевдоним CP874
псевдоним IBM874
псевдоним IBM-874
псевдоним 874