Cet article décrit l'utilisation des caractères chinois à Pinyin4j en Java. Partagez-le pour votre référence, comme suit:
La conversion des caractères chinois en pinyin est un problème très courant dans le développement quotidien. Par exemple, dans notre excellent 12306, si vous entrez "Wh" dans le nom du lieu, vous verrez des noms de lieux tels que "wuhan", "wuhu" et "weihai", et si vous entrez "wuhu", vous verrez "wuhu".
Java obtient le pinyin des caractères chinois, et la bibliothèque Pinyin4j peut bien résoudre ce problème.
Télécharger l'adresse: http://sourceforge.net/projects/pinyin4j/
Téléchargez et dézip, il y a un pinyin4j-2.5.0.jar à l'intérieur, utilisez simplement cette bibliothèque.
Caractères chinois à Pinyin:
La copie de code est la suivante: String [] pinyin = pinyinhelper.tohanyupinyinstringArray ('rere-re-re-);
La ligne de code ci-dessus consiste à convertir un seul caractère chinois en un pinyin, comme le mot "lourd", qui renvoie un tableau de type de chaîne:
"Zhong4"
"Chong2"
"金" est un caractère polyphonique, et le tableau de retour de cette méthode contient le pinyin de toutes les prononciations de ce caractère. Le dernier nombre de chaque prononciation est le ton (le premier, deuxième, troisième, quatrième, pas besoin d'expliquer cela).
Ce qui précède est le moyen le plus simple d'obtenir un seul caractère chinois. Vous pouvez également utiliser HanyupinyInOutputFormat pour formater le format qui renvoie le pinyin.
HanyupinyInOutputFormat Format = new HanyupinyInOutputTormat (); // UpperCase: Uppercase (Zhong) // minuscules: minuscules (zhong) format.SetCasetype (HanyupinyIncasetype.LowerCase); // Without_Tone: Aucun symbole britannique (Zhong) // avec_ (zhong4) // avec_tone_mark: utiliser directement les symboles phonétiques (avec_u_unicode doit être utilisé autrement anormal) (zhòng) format.settonetype (hanyupinyintonetype.with_tone_mark); // avec_v: utiliser v pour représenter ü (nv) // avec_u_and_colon: With_u_unicode: utilisez ü (nü) format.setvchartype (hanyupinyinvchartype.with_u_unicode); string [] pinyin = Pinyinhelper.tohanyupinyinstringArray ('rere-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re- rere-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re e-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re -re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-Re-RE format); tohanyupinyinstringArray Si le personnage est passé n'est pas un caractère chinois et ne peut pas être converti en pinyin, il reviendra directement nul.Bien que Pinyin4J soit très utile, il a toujours des limites. Le code ci-dessus ne peut obtenir que le pinyin d'un seul caractère chinois, mais ne peut pas obtenir le pinyin d'un mot contenant des caractères polyphoniques. Par exemple, "chongqing", il est impossible de déterminer s'il s'agit de "chongqing" ou de "zhongqing", et Pinyin4j ne peut pas juger la prononciation des caractères polyphoniques à travers le contexte.
Par conséquent, lors de l'obtention de la prononciation d'un mot contenant des caractères polyphoniques, vous pouvez revenir à une liste, et la prononciation correcte ne peut être jugée manuellement et sélectionnée.
J'espère que cet article sera utile à la programmation Java de tous.