この記事では、JavaのPinyin4Jへの漢字の使用について説明します。次のように、参照のために共有してください。
漢字からピンインへの変換は、毎日の発達において非常に一般的な問題です。たとえば、私たちの偉大な12306では、「WH」を地名に入力すると、「wuhan」、「wuhu」、「weihai」などの地名が表示され、「wuhu」に入ると「wuhu」が表示されます。
Javaは漢字のピニインを取得し、Pinyin4Jライブラリはこの問題をうまく解決できます。
住所をダウンロード:http://sourceforge.net/projects/pinyin4j/
ダウンロードして解凍すると、内部にpinyin4j-2.5.0.jarがあります。このライブラリを使用してください。
ピニインへの漢字:
コードコピーは次のとおりです。String[] Pinyin = pinyinhelper.tohanyupinyinstringarray( 'rer-re-re-);
上記のコード行は、文字列タイプの配列を返す「重い」という言葉など、単一の漢字をピニインに変換することです。
「Zhong4」
「Chong2」
「金」はポリフォニックなキャラクターであり、この方法のリターン配列には、このキャラクターのすべての発音のピニインが含まれています。各発音の最後の数はトーンです(最初、2番目、3番目、4番目、これを説明する必要はありません)。
上記は、単一の漢字を取得する最も簡単な方法です。 HanyupinyInoutputFormatを使用して、Pinyinを返す形式をフォーマットすることもできます。
hanyupinyinoutputformat format = new hanyupinyinoutputformat(); // uppercase:appercase(zhong)// loshcase:lowercase(zhong)format.setcaseType(hanyupinyincaseType.lowercase); (Zhong4)// with_u_unicode:useü(nü)format.setvchartype(hanyupinyinvchartype.with_u_unicode); string [] pinyin = PinyinHelper.toHanyuPinyinStringArray('re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re- re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-r e-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re -re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re format); tohanyupinyinstringarray渡されたキャラクターは漢字ではなく、ピニインに変換できない場合、直接nullを返します。Pinyin4Jは非常に便利ですが、まだ制限があります。上記のコードは、単一の漢字のピニインのみを取得できますが、ポリフォニック文字を含む単語のピニインを取得することはできません。たとえば、「チョンキン」、それが「チョンキン」または「Zhongqing」かを判断することは不可能であり、Pinyin4Jは文脈を通じてポリフォニック文字の発音を判断できません。
したがって、ポリフォニック文字を含む単語の発音を取得する場合、リストに戻ることができ、正しい発音は手動で判断され選択されます。
この記事がみんなのJavaプログラミングに役立つことを願っています。