泰米尔补充(Tamil Supplement):Unicode中对泰米尔文字的扩展,书写介质同上。 泰卢固文字(Telugu):源自婆罗米文字,经由卡罗什提和帕拉瓦体演变。最初在棕榈叶上用铁笔刻写。 塔安那文字(Thaana):17世纪在马尔代夫发展,用于书写迪维希语。最初在棕榈叶或纸上用墨水和笔书写。 蒂尔胡塔文字(Tirhuta):也称迈蒂利文字,14...
31F0-31FF Katakana Phonetic Extensions, 日文片假名 3200-33FF Enclosed CJK Letters and Months, 中日韩组合符号字 3400-4DBF CJK Unified Ideographs Extension A, 中文 4DC0-4DFF Yijing Hexagram Symbols, 易经符号 4E00-9FFF CJK Unified Ideographs, 中文 A000-A4CF Yi, 彝文 A4D0-A6FF 保留 A700-A7...
3200-33FF Enclosed CJK Letters and Months,中日韓組合符號字 3400-4DBF CJK Unified Ideographs Extension A,中文 4DC0-4DFFYijingHexagram Symbols,易經符號 4E00-9FFF CJK Unified Ideographs,中文 A000-A4CF Yi,彝文 A4D0-A6FF保留 A700-A71F Modifier Tone Letters,音標符號 A720-A7FF保留 A800-A82FSylot...
1、0000-007F Basic Latin 基本拉丁字母 0080-00FF Latin-1 Supplement 拉丁字母補充-1 0100-017F Latin Extended-A 拉丁字母擴充-A 0180-024F Latin Extended-B 拉丁字母擴充-B 0250-02AF IPA Extensions 國際音標擴充 02B0-02FF Spacing Modifier Letters 進格修飾字元 0300-036F Combining Diacritical Marks...
Unicode 编码范围(Unicode blocks) 0x0000-0x001F:控制字符 (Control character)0x0020-0x007F:基本拉丁字母 (Basic Latin)0x0080-0x00FF:拉丁文补充1(Latin-1 Supplement)0x0100-0x
Unicode(也称:统一码、万国码、单一码),是世界上统一用在计算机上的字符编码。Unicode,是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符,设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
for (int i = 0; i < sentence.length(); i++){ char c = sentence.charAt(i); if ((c >= 0x4e00)&&(c <= 0x9fbb)){ System.out.println("中文"); } } 0000:Basic Latin 基本拉丁语 0080:Latin-1 Supplement 拉丁语-1补遗 0100:Latin Extended-A 拉丁语扩充-A ...
3200-33FF Enclosed CJK Letters and Months, 中日韩组合符号字 3400-4DBF CJK Unified Ideographs Extension A, 中文 4DC0-4DFF Yijing Hexagram Symbols, 易经符号 4E00-9FFF CJK Unified Ideographs, 中文 A000-A4CF Yi, 彝文 A4D0-A6FF 保留
- Tamil Supplement楔形文字(12000-123FF)- Cuneiform楔形文字数字和标点符号(12400-1247F)- Cuneiform Numbers and Punctuation古代楔形文字(12480-1254F)- Early Dynastic Cuneiform埃及象形文字(13000-1342F)- Egyptian Hieroglyphs 贴吧用户_QbAaQGA 沝淼淼淼 11 埃及象形文字格式控制(13430-1343F)- Egyptian ...
08:51:54* unicode字碼分佈表0000-007f c0 control and basic latin, 標準ansi字元0080-00ff c1 control and latin-1 supplement, 控制碼與拉丁文0100-024f latin extended, 拉丁文0250-02af ipa extensions, 拉丁文02b0-02ff spacing modifier letters, 符號0300-036f combining diacritical marks, 組合記號0...