UnicodeとUTFの関係に関しては、Unicodeはコーディング組織であり、Coding仕様であり、JavaのUTF-16を指します。ネットワークには、8、16、32などのUTFの複数の形式があり、LEとTEの違いが次のプロセスに10個のユニコードエンコード形式がある場合にのみあります。
コードコピーは次のとおりです。
public static void main(string [] args)はunsupportedencodingceptionをスローします{
stringutil.str2all( "0製品モデルの説明");
stringutil.str4all( "30000900A74EC1548B57F753CF63F08F");
}
/**
*すべてのエンコード形式で16進数文字列をエンコードしてみてください
*
* @param hexstr
* @Throws unsupportedencodingException
*/
public static void str4all(string ustr)は、unsupportedencodingceptionをスローします{
System.out.println( "+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++++++++++++++++++ ");
byte [] bs = new byte [usttr.length()/2];
for(int i = 0; i <bs.length; i ++){
bs [i] =(byte)integer.parseint(usttr.substring(i*2、i*2+2)、16);
}
System.out.println(new String(bs、 "utf-8"));
// 16
system.out.println(new String(bs、 "utf-16"));
System.out.println(new String(bs、 "utf-16le"));
System.out.println(new String(bs、 "x-utf-16le-bom"));
System.out.println(new String(bs、 "utf-16be"));
//system.out.println(new String(bs、 "x-utf-16be-bom"));
// 32
System.out.println(new String(bs、 "utf-32"));
System.out.println(new String(bs、 "utf-32le"));
System.out.println(new String(bs、 "x-utf-32le-bom"));
System.out.println(new String(bs、 "utf-32be"));
System.out.println(new String(bs、 "x-utf-32le-bom"));
}
/**
*エンコードに対応するすべてのデコードされた16進数文字列をリストします
*
* @Param USTR
* @Throws unsupportedencodingException
*/
public static void str2all(string ustr)はunsupportedencodingceptionをスローします{
System.out.println( "+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++++++++++++++++++ ");
byte [] bs = new byte [] {};
bs = usttr.getBytes( "utf-8");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
// 16
bs = usttr.getBytes( "utf-16");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "utf-16le");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "x-utf-16le-bom");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "utf-16be");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
// bs = usttr.getBytes( "x-utf-16be-bom");
// 32
bs = usttr.getBytes( "utf-32");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "utf-32le");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "x-utf-32le-bom");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "utf-32be");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
bs = usttr.getBytes( "x-utf-32le-bom");
for(byte b:bs){
System.out.print(integer.tohexstring(b&0xff));
}
System.out.println();
}
コーディング名のコレクション
コードコピーは次のとおりです。
charset us-ascii%s
HistoricalName ascii
#IANAエイリアス
エイリアスISO-IR-6
エイリアスansi_x3.4-1986
エイリアスISO_646.IRV:1991
エイリアスASCII
エイリアスISO646-US
エイリアス私たち
エイリアスIBM367
エイリアスCP367
エイリアスCSASCII
エイリアスデフォルト
#他のエイリアス
エイリアス646#solaris posixロケール
エイリアスISO_646.IRV:1983
エイリアスansi_x3.4-1968#linux posixロケール(redhat)
エイリアスASCII7
charset utf-8 utf_8
HistoricalName UTF8
エイリアスUTF8
エイリアスUnicode-1-1-UTF-8
charset utf-16 utf_16
HistoricalName UTF-16
エイリアスUTF_16
エイリアスUTF16
エイリアスUnicode
エイリアスunicodebig
charset utf-16be utf_16be
HistoricalName unicodebigunmarked
エイリアスutf_16be
エイリアスISO-10646-UCS-2
エイリアスX-UTF-16BE
エイリアスunicodebigunmarked
charset utf-16le utf_16le
HistoricalName Unicodelittleunmarked
エイリアスutf_16le
エイリアスX-UTF-16LE
エイリアスUnicodelittleunmarked
charset x-utf-16le-bom utf_16le_bom
HistoricalName Unicodelittle
エイリアスUnicodelittle
charset utf-32 utf_32
エイリアスUTF_32
エイリアスUTF32
charset utf-32le utf_32le
エイリアスutf_32le
エイリアスX-UTF-32LE
charset utf-32be utf_32be
エイリアスutf_32be
エイリアスX-UTF-32BE
Charset X-UTF-32LE-BOM UTF_32LE_BOM
エイリアスutf_32le_bom
エイリアスUTF-32LE-BOM
charset x-utf-32be-bom utf_32be_bom
エイリアスutf_32be_bom
エイリアスUTF-32BE-BOM
charset ISO-8859-1%s
HistoricalName ISO8859_1
#IANAエイリアス
エイリアスISO-IR-100
エイリアスISO_8859-1
エイリアスlatin1
エイリアスL1
エイリアスIBM819
エイリアスCP819
エイリアスCsisolatin1
#他のエイリアス
エイリアス819
エイリアスIBM-819
エイリアスISO8859_1
エイリアスISO_8859-1:1987
エイリアスISO_8859_1
エイリアス8859_1
エイリアスISO8859-1
charset ISO-8859-2%s
HistorialName ISO8859_2
エイリアスISO8859_2
エイリアス8859_2
エイリアスISO-IR-101
エイリアスISO_8859-2
エイリアスISO_8859-2:1987
エイリアスISO8859-2
エイリアスlatin2
エイリアスL2
エイリアスIBM912
エイリアスIBM-912
エイリアスCP912
エイリアス912
エイリアスCsisolatin2
charset ISO-8859-4%s
HistorialName ISO8859_4
エイリアスISO8859_4
エイリアスISO8859-4
エイリアス8859_4
エイリアスISO-IR-110
エイリアスISO_8859-4
エイリアスISO_8859-4:1988
エイリアスlatin4
エイリアスL4
エイリアスIBM914
エイリアスIBM-914
エイリアスCP914
エイリアス914
エイリアスCsisolatin4
charset ISO-8859-5%s
HistorialName ISO8859_5
エイリアスISO8859_5
エイリアス8859_5
エイリアスISO-IR-144
エイリアスISO_8859-5
エイリアスISO_8859-5:1988
エイリアスISO8859-5
エイリアスキリル語
エイリアスIBM915
エイリアスIBM-915
エイリアスCP915
エイリアス915
エイリアスcsisolatincyrillic
charset ISO-8859-7%s
HistorialName ISO8859_7
エイリアスISO8859_7
エイリアス8859_7
エイリアスISO-IR-126
エイリアスISO_8859-7
エイリアスISO_8859-7:1987
エイリアスELOT_928
エイリアスECMA-118
エイリアスギリシャ語
エイリアスGreek8
エイリアスcsisolatingreek
エイリアスsun_eu_greek#solaris 7/8互換性
エイリアスIBM813
エイリアスIBM-813
エイリアス813
エイリアスCP813
エイリアスISO8859-7#SOLARIS 9互換性
charset ISO-8859-9%s
HistorialName ISO8859_9
エイリアスISO8859_9
エイリアス8859_9
エイリアスISO-IR-148
エイリアスISO_8859-9
エイリアスISO_8859-9:1989
エイリアスISO8859-9
エイリアスlatin5
エイリアスL5
エイリアスIBM920
エイリアスIBM-920
エイリアス920
エイリアスCP920
エイリアスcsisolatin5
charset ISO-8859-13%s
HistoricalName ISO8859_13
エイリアスISO8859_13
エイリアス8859_13
エイリアスISO_8859-13
エイリアスISO8859-13
charset ISO-8859-15%s
HistoricalName ISO8859_15
#IANAエイリアス
エイリアスISO_8859-15
#他のエイリアス
エイリアス8859_15
エイリアスISO8859_15
エイリアスISO8859-15
エイリアスIBM923
エイリアスIBM-923
エイリアスCP923
エイリアス923
エイリアスlatin0
エイリアスlatin9
エイリアスL9
エイリアスCSISOLATIN0
エイリアスcsisolatin9
エイリアスISO8859_15_FDIS
charset koi8-r%s
HistoricalName Koi8_r
エイリアスkoi8_r
エイリアスkoi8
エイリアスcskoi8r
charset koi8-u%s
エイリアスkoi8_u
Charset Windows-1250%s
HistoricalName CP1250
エイリアスCP1250
エイリアスCP5346#EURO IBM CCSID
Charset Windows-1251%s
HistoricalName CP1251
エイリアスCP1251
エイリアスCP5347#EURO IBM CCSID
エイリアスANSI-1251#solaris互換性
Charset Windows-1252%s
HistoricalName CP1252
エイリアスCP1252
エイリアスCP5348#EURO IBM CCSID
Charset Windows-1253%s
HistoricalName CP1253
エイリアスCP1253
エイリアスCP5349#EURO IBM CCSID
Charset Windows-1254%s
HistoricalName CP1254
エイリアスCP1254
エイリアスCP5350#EURO IBM CCSID
Charset Windows-1257%s
HistoricalName CP1257
エイリアスCP1257
エイリアスCP5353#EURO IBM CCSID
charset ibm437%s
HistoricalName CP437
エイリアスCP437
エイリアスIBM-437
エイリアス437
エイリアスCSPC8CodePage437
エイリアスWindows-437
charset x-ibm737%s
HistoricalName CP737
エイリアスCP737
エイリアスIBM737
エイリアスIBM-737
エイリアス737
charset ibm775%s
HistoricalName CP775
エイリアスCP775
エイリアスIBM-775
エイリアス775
チャーセットIBM850%s
HistoricalName CP850
エイリアスCP850
エイリアスIBM-850
エイリアス850
エイリアスCSPC850Multilingual
チャーセットIBM852%s
HistoricalName CP852
エイリアスCP852
エイリアスIBM-852
エイリアス852
エイリアスCSPCP852
チャーセットIBM855%s
HistoricalName CP855
エイリアスCP855
エイリアスIBM-855
エイリアス855
エイリアスCSPCP855
チャーセットIBM857%s
HistoricalName CP857
エイリアスCP857
エイリアスIBM-857
エイリアス857
エイリアスCSIBM857
charset ibm00858%s
HistoricalName CP858
エイリアスCP858
エイリアスCCSID00858
エイリアスCP00858
エイリアス858
チャーセットIBM862%s
HistoricalName CP862
エイリアスCP862
エイリアスIBM-862
エイリアス862
エイリアスCSIBM862
エイリアスCSPC862LATINHEBREW
チャーセットIBM866%s
HistoricalName CP866
エイリアスCP866
エイリアスIBM-866
エイリアス866
エイリアスCSIBM866
charset x-ibm874%s
HistoricalName CP874
エイリアスCP874
エイリアスIBM874
エイリアスIBM-874
エイリアス874