이 기사에서는 Java의 Pinyin4J 로의 중국어 사용에 대해 설명합니다. 다음과 같이 참조에 대해 공유하십시오.
중국어를 Pinyin으로 전환하는 것은 매일 개발에서 매우 일반적인 문제입니다. 예를 들어, 우리의 위대한 12306에서 "wh"를 장소 이름에 입력하면 "wuhan", "wuhu"및 "wuihai"와 같은 장소 이름이 표시되며 "wuhu"를 입력하면 "Wuhu"가 표시됩니다.
Java는 한자의 Pinyin을 얻고 Pinyin4J 라이브러리는이 문제를 잘 해결할 수 있습니다.
다운로드 주소 : http://sourceforge.net/projects/pinyin4j/
다운로드하고 압축을 풀면 Pinyin4J-2.5.0.jar가 있습니다.이 라이브러리 만 사용하십시오.
중국어에게 Pinyin :
코드 사본은 다음과 같습니다. String [] pinyin = pinyinhelper.tohanyUpinyInstringArray ( 're-re-re-re-);
위의 코드 라인은 단일 중국어를 "Heavy"라는 단어와 같은 Pinyin으로 변환하는 것입니다.이 단어는 문자열 유형을 반환합니다.
"Zhong4"
"chong2"
"ph"는 다성 문자이며,이 방법의 리턴 배열에는이 문자의 모든 발음의 핀 얀이 포함되어 있습니다. 각 발음의 마지막 수는 톤입니다 (첫 번째, 두 번째, 세 번째, 네 번째, 이것을 설명 할 필요가 없습니다).
위는 한자를 단 한 명을 얻는 가장 쉬운 방법입니다. HanyuPinyInoutputformat을 사용하여 Pinyin을 반환하는 형식을 형식화 할 수도 있습니다.
HanyUpinyInoutputformat 형식 = new HanyUpinyInoutputformat (); // 대문자 : 대문자 (Zhong) // 소문자 : 소문자 (Zhong) Format.setCaseType (hanyUpinyIncasetype.lowercase); // nophonetic Symbol (Zhong) // with_tone_number : 1-4 number 표준 (zhong 4). with_tone_mark : 발음 기호를 직접 사용하십시오 (with_u_unicode는 비정상적으로 사용해야합니다. ü (nü) format.setvchartype (hanyupinyinvchartype.with_u_unicode); String [] pinyin = PinyinHelper.ToHanyUpinyInstringArray ( 're-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re- re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-r-re-re-r-re-re-re-re-re-re-re-r e-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-ree가 -re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re- 형식); TohanyUpinyInstringArray 통과 된 캐릭터가 중국어가 아니며 Pinyin으로 변환 할 수 없으면 Null을 직접 반환합니다.
Pinyin4J는 매우 유용하지만 여전히 한계가 있습니다. 위의 코드는 단일 중국어의 Pinyin 만 얻을 수 있지만 다식 문자가 포함 된 단어의 Pinyin을 얻을 수는 없습니다. 예를 들어, "chongqing", 그것이 "chongqing"또는 "zhongqing"인지 판단하는 것은 불가능하며, Pinyin4J는 맥락을 통해 다식 문자의 발음을 판단 할 수 없습니다.
따라서, 다식 문자가 포함 된 단어의 발음을 얻을 때, 당신은 목록으로 돌아갈 수 있으며, 올바른 발음은 수동으로 판단되고 선택 될 수 있습니다.
이 기사가 모든 사람의 Java 프로그래밍에 도움이되기를 바랍니다.