В этой статье описывается использование китайских иероглифы для Pinyin4J в Java. Поделитесь этим для вашей ссылки, следующим образом:
Преобразование китайских иероин в пиньин является очень распространенной проблемой в повседневном развитии. Например, в нашем великом 12306, если вы введете «WH» в имя места, вы увидите такие имена мест, как «Ухан», «Уху» и «Вейхай», и если вы войдете в «Уху», вы увидите «Уху».
Java получает пинин китайских иероглифы, и библиотека Pinyin4J может хорошо решить эту проблему.
Адрес загрузки: http://sourceforge.net/projects/pinyin4j//
Загрузите и раскачивайте его, внутри есть pinyin4j-2.5.0.jar, просто используйте эту библиотеку.
Китайские иероглифы на пинин:
Кода кода выглядит следующим образом: string [] pinyin = pinyinhelper.tohanyupinyinstringarray ('Re-re-re-);
Вышеуказанная строка кода состоит в том, чтобы преобразовать один китайский символ в пиньин, такой как слово «тяжелый», которое возвращает массив типа строки:
"Zhong4"
"Чонг2"
«金» является полифоническим символом, и возвращаемый массив этого метода содержит пинкин всех произношений этого символа. Последнее число каждого произношения - это тон (первый, второй, третий, четвертый, не нужно объяснять это).
Вышеупомянутое - самый простой способ получить единственного китайского персонажа. Вы также можете использовать hanyupinyinoutputformat, чтобы форматировать формат, который возвращает пининин.
Hanyupinyinoutputformat format = new hanyupinyinoutputformat (); // uppercare: uppercare (Zhong) // Защитный список: нижний суд (Zhong) Format.SetCaseType (hanyupinyincaseType.lowercase); // Без_Tone: No Phonetic Symbol (Zhong) // с_Тоне. With_tone_mark: используйте фонетические символы напрямую (with_u_unicode должен использоваться в противном случае аномально) (zhòng) format.settonetype (hanyupinyntonetype.with_tone_mark); // with_v: v для представления ü (nv) // with_und_colon: u: With_unicode: используйте ü (nü) format.setvchartype (hanyupinyinvchartype.with_unicode); string [] pinyin = Pinyinhelper.tohanyupinyinstringarray ('re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re- Re-Rre-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-r e-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re -re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-re-ре- формат); tohanyupinyinstringarray Если переданный персонаж не является китайским символом и не может быть преобразован в пиньин, он непосредственно вернет ноль.Хотя Pinyin4J очень полезен, он все еще имеет ограничения. Приведенный выше код может получить только пинкин одного китайского символа, но не может получить пинкин слова, содержащего полифонические символы. Например, «Чунцин», невозможно определить, является ли это «Чунцином» или «Чжунцином», и Pinyin4J не может судить о произношении полифонических символов через контекст.
Следовательно, при получении произношения слова, содержащего полифонические символы, вы можете вернуться в список, и правильное произношение можно только вручную оценить и выбрать.
Я надеюсь, что эта статья будет полезна для всех Java Programming.