Java determina que os caracteres são o código de exemplo chinês (super útil)

Autor：Eve Cole Data da Última Atualização：2025-08-21 12:48:02

Ao trabalhar em projetos, você geralmente encontra alguns problemas necessários para julgar se os personagens são chineses, então você coletou trechos de código para julgar os caracteres chineses. Aqui estão algum compartilhamento para sua referência.

Publiquei o código diretamente, com comentários detalhados nele.

 pacote com.coder4j.main; importar java.util.regex.pattern;/*** Java julga caracteres chineses** @Author Chinaxiang* @Date 2015-08-11 **/public classe checkchinese {public static void main (string [] args) {///////9//public "Olá, Tom.!@#$%^&*() _+-= {} | []; ':/"? "; // chinês puro (excluindo a pontuação chinesa) string s2 =" hello, China "." ":"' ''; () []! = "" "String s8 =" ╂ "; // String chinesa tradicional s9 =" antiga "; // 1 Use o intervalo de caracteres para determinar se o sistema.out.println (" s1 contém chinês: " + tem chinêsbyRange (s1); // falsesystem.out.printn (" s2 contém chinês: " + tem chinês; Chinês: " + possui range chinesa (s3)); // truesystem.out.println (" s4 contém chinês: " + tem chinês de ranha (s4)); // falsesystem.out.println (" s5 contém chinês: " + chineses housbynange (s5); // falsystem.out.prInt.PRAND.PRANGEN.PRANGENS.PRANSTING.PRANSTING. ChineseByRange (S6)); // Falsesystem.out.println ("S7 contém chinês:" + possui range chinês (S7)); // Falsesystem.out.println ("s8 contém chinês:" + hounbybynge (s8); truesystem.out.println ("-------------------"); System.out.println ("S1 é todo chinês:" + é chinês de raia (S1)); // Falsesystem.out.println ("S2 é todo chinês:" + é o range chinês (S2); // Truesystan.out.println ("S3 é todo chinês:" +chesthesebyseby (S3); System.out.println ("S4 é todo chinês:" + ischinesebyRange (S4)); // Falsesystem.out.println ("S5 é todo chinês:" + isquinesebyRange (S5)); // Falsystem.out.println ("S6 é tudo chinês:" Falsesystem.out.println ("S7 é todo chinês:" + ischinesebyRange (S7)); // Falsesystem.out.println ("S8 é todo chinês:" + isChinesebyRange (S8)); // Falsystem.out.println ("S9 All is All is All truesystem.out.println ("---------------"); // 2 Use o julgamento regular da faixa de caracteres (o resultado é o mesmo que 1) System.out.println ("S1 contém chinês:" + tem chinês/s1); // Falsystem.out.println ("S2 contém chinês:" + haschin truesystem.out.println ("s3 contém chinês:" + tem chinêsbyreg (s3)); // truesystem.out.println ("s4 contém chinês:" + tem chinêsbyreg (s4); // falsesystem.out.println ("s5 contém chinês:" + hastybygen); Chinês: " + possui chinêsbyreg (s6)); // falsesystem.out.println (" s7 contém chinês: " + tem chinêsbyreg (s7)); // falsystem.out.println (" s8 contém chinês: " + tem chinês (s8 s8); truesystem.out.println ("-------------------"); System.out.println ("S1 é todo chinês:" + é chinêsbyreg (S1)); // Falsesystem.out.println ("S2 é todo chinês:" + é chinês (s2)); // truesystem.out.println ("s3 é chinês:" + ischeseby (s3); System.out.println ("S4 é todo chinês:" + ischinesebyreg (s4)); // falsesystem.out.println ("s5 é todo chinês:" + ischinesebyreg (s5); // falsystem.out.println ("s6 é tudo chinês:" + éschin Falsesystem.out.println ("S7 é todo chinês:" + ischinesebyreg (s7)); // falsesystem.out.println ("s8 é todo chinês:" + isChinesebyreg (s8)); // falsystem.out.println ("s9 é all chinês:" truesystem.out.println ("----------------"); // 3 Use o conjunto de caracteres CJK para determinar se o System.out.println ("S1 contém chinês:" + haschinese (s1));/ falsystem.out.println ("s2 contém chinês:" + haschinese (s2); " + possui chinês (s3)); // truesystem.out.println (" s4 contém chinês: " + tem chinês (s4)); // Falsesystem.out.println (" s5 contém chinês: " + tem chinês (s5)); // Falsystem.out.println (" s6 Falsesystem.out.println ("S7 contém chinês:" + possui chinês (s7)); // falsesystem.out.println ("s8 contém chinês:" + haschinese (s8)); // falsystem.out.println ("s9 contém chinês:" + haschinês (s9); truesystem.out.println ("-------------------"); System.out.println ("S1 é todo chinês:" + isquineses (S1)); // Falsesystem.out.println ("S2 é todo chinês:" + ischinese (s2); isquineses (S3)); // A verdadeira pontuação chinesa também está incluída em System.out.println ("S4 é todo chinês:" + isquineses (S4)); // Falsesystem.out.println ("S5 é todo chinês:" + ischinese (s5); isChinese(s6));// falseSystem.out.println("s7 is all Chinese: " + isChinese(s7));// falseSystem.out.println("s8 is all Chinese: " + isChinese(s8));// falseSystem.out.println("s9 is all Chinese: " + isChinese(s9));// true}/*** se ele contém caracteres chineses <br>* contém pontuação chinesa <br>** @param str* @return*/public static boolean possui chinês (string str) {if (str == null) {return;} char [] chinês (str.toChary (); para (char c: ch);}}; Todos os caracteres chineses <br>* contém pontuação chinesa <br>** @param str* @return*/public static boolean isnchinês (string str) {if (str == null) {return false;} char [] chinese (str.toCharArray (); para (char c: ch) {se (! caractere <br>* contém pontuação chinesa <br>** @param c* @return*/private estático booleano isquineso (char c) {caractere.unicodeblock ub = caractere.unicodeblock.of (c); if (ub == caractere.unicodeblock.cjk_unified_ideographs); Caractere.unicodeblock.cjk_compatibility_ideographs) {return true;} else if (ub == caractere.unicodeblock.cjk_symbols_and_punctuation) {return true;} else (ub == caractere.unicodeblock.cjk}}}}; Caractere.unicodeblock.cjk_unified_ideographs_extension_b) {return true;} else if (ub == caractere.unicodeblock.cjk_unified_ideographs_extension_c) {retorna true;} se (ub == caractere.unicodeblock) Caractere.unicodeblock.general_punctuation) {return true;} else if (ub == caractere.unicodeblock.halfwidth_and_fullwidth_forms) {return true;} retorna false;}/***, se os caracteres chineses são incluídos <br>* juiz baseado no codificação de caracteres chineses <br> *** cjk, que os caracteres chineses são incluídos em chinês (não -tabela de caracteres chineses **l. etc.) <br>** @param str* @return*/public static boolean possui chinêsbyreg (string str) {if (str == null) {return false;} padrão padrony = padrão.compile ("[// u4e00-// u9fbf]+"); retorno. caracteres <br>* CJK unificou os caracteres chineses (não incluindo chinês, "《》 ()" '' ",! ￥ e outros símbolos) <br>** @param str* @return*/public static boolean ischinesebyreg (string str) {if (str == null) {return false;} padrony = padring..Catwer..C) Pattern.Matcher (str) .matches ();}/*** Se os caracteres chineses estão incluídos <br>* Juiz com base na faixa de codificação de caracteres chineses <br>* CJK Unificado caracteres chineses (não incluindo chinês "《》 ()" '' '',! false;} char [] ch = str.toCharArray (); para (char c: ch) {if (c> = 0x4e00 && c <= 0x9fbf) {return true;}} retorna false;}/*** se todos os caracteres chineses são chineses <br>* juiz baseado no codificação de caracteres "" *** **** ckk unstem que são chineses <br>* juiz baseado no codificação "" etc.) <br>** @param str* @return*/public estático booleano ischinesebyRange (string str) {if (str == null) {return false;} char [] ch = str.toCharArray (); para (char c: ch) {if (c <0x4e00 || c> 0x9fbf) {c) {if (c <0x4e00 |

Se você julga apenas se é chinês sem julgar a pontuação chinesa, é recomendável usar a correspondência regular, o que pode ser mais eficiente.

O conteúdo do código acima apresenta o código de exemplo de Java para julgar os personagens como chineses (super úteis), e espero que seja útil para você.