Unicode编码 Unicode(也称:统一码、万国码、单一码),是世界上统一用在计算机上的字符编码。Unicode,是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符,设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。 Unicode,是为了解决传统的字...
for (int i = 0; i < sentence.length(); i++){ char c = sentence.charAt(i); if ((c >= 0x4e00)&&(c <= 0x9fbb)){ System.out.println("中文"); } } 0000:Basic Latin 基本拉丁语 0080:Latin-1 Supplement 拉丁语-1补遗 0100:Latin Extended-A 拉丁语扩充-A 0180:Latin Extended-B ...
泰米尔语(0B80-0BFF) - Tamil 泰卢固语(0C00-0C7F) - Telugu 坎那达语(0C80-0CFF) - Kannada 马拉雅拉姆语(0D00-0D7F) - Malayalam 僧伽罗语(0D80-0DFF) - Sinhala 泰语(0E00-0E7F) - Thai 老挝语(0E80-0EFF) - Lao 藏语(0F00-0FFF) - Tibetan 缅甸语(1000-109F) - Myanmar 格鲁吉亚...
devanagari天城體梵文一種印度文098009ffbengali孟加拉文0a000a7fgurmukhi古爾穆基文一種印度文0a800affgujarati古吉拉特文一種印度文0b000b7foriya奧里雅文一種印度文0b800bfftamil泰米爾文一種印度文0c000c7ftelugu泰盧固文一種印度文0c800cffkannada卡納達文一種印度文0d000d7fmalayalam馬拉雅拉姆文一種印度文0d800dff...
0B80-0BFF:泰米尔文 (Tamil) 0C00-0C7F:泰卢固文 (Telugu) 0C80-0CFF:卡纳达文 (Kannada) 0D00-0D7F:德拉维族语 (Malayalam) 0D80-0DFF:僧伽罗语 (Sinhala) 0E00-0E7F:泰文 (Thai) 0E80-0EFF:老挝文 (Lao) 0F00-0FFF:藏文 (Tibetan) 1000-109F:缅甸语 (Myanmar) 10A0-10FF:格鲁吉亚语...
"20D0-20FF😄组合用记号😄Combining Diacritics Marks for Symbols", "2100-214F😄字母式符号😄Letterlike Symbols", "2150-218F😄数字形式😄Number Form", "2190-21FF😄箭头😄Arrows", "2200-22FF😄数学运算符😄Mathematical Operator", ...
2944 3071 0B80 0BFF 128 泰米尔文 Tamil 3072 3199 0C00 0C7F 128 泰卢固文 Telugu 3200 3327 0C80 0CFF 128 卡纳达文 Kannada 3328 3455 0D00 0D7F 128 德拉维族语 Malayalam 3456 3583 0D80 0DFF 128 僧伽罗语 Sinhala 3584 3711 0E00 0E7F 128 泰文 Thai 3712 3839 0E80 0EFF 128 老挝文...
Letters of Basic Latin: U+0041–U+007A・基本拉丁 Letters of the Latin-1 Supplement: U+00C0–U+00FF・拉丁-1 增补 Latin Extended-A: U+0100–U+017F・拉丁扩充-A Latin Extended-B: U+0180–U+024F・拉丁扩充-B IPA Extensions: U+0250–U+02AF・国际音标扩充 ...
•Spacing marks such as U+0BCA tamil vowel sign o may be rendered on bothsides of a base character, but are not enclosing marks. D56 Combining character sequence: A maximal character sequence consisting of either abase character followed by a sequence of one or more charact...