赋予每个字符一个唯一的编号,只不过对于同一个字符,GB18030 和 Unicode 对应的编号是不一样的, 比如:汉字 "中" 字的 GB18030 编码是 0xD6D0, 对应的 Unicode 码元是 0x4E2D, 从这一点上可以认为 GB18030 是一种 Unicode 的转换格式
● 中国人民通过对 ASCII 编码的中文扩充改造,产生了 GB2312 编码,可以表示6000多个常用汉字。 ● 汉字实在是太多了,包括繁体和各种字符,于是产生了 GBK 编码,它包括了 GB2312 中的编码,同时扩充了很多。 ● 中国是个多民族国家,各个民族几乎都有自己独立的语言系统,为了表示那些字符,继续把 GBK 编码扩充为 GB...
因此,GBK作为GB2312的扩展标准应运而生,增加了更多的汉字和符号。而GB18030则是在GBK的基础上进一步扩展,成为目前中国大陆法定的字符集编码标准,不仅兼容了GB2312和GBK,还进一步增补了更多字符,以适应更加广泛的应用需求。
2、对于大部分中文字符来说,采用 GB18030 编码的话,只需两个字节,如果采用 UTF8 编码,就需要三个字节, 所以用 GB18030 存储和传输更节省空间 ASICII、GB2312、GBK、GB18030 以及 UTF8 的关系 它们的关系如下图 由上图可知,GB2312、GBK、GB18030 以及 UTF8 共同点是都兼容 ASICII 全角和半角字符 使用输入法...
GBK和GB2312都是双字节等宽编码,如果算上和ASCII兼容所支持的单字节,也可以理解为是单字节和双字节混合的变长编码。GB18030编码是变长编码,有单字节、双字节和四字节三种方式。 GB18030的单字节编码范围是0x00-0x7F,完全等同与ASCII;双字节编码的范围和GBK相同,高字节是0x81-0xFE,低字节的编码范围是0x40-0x7E...
由上图可知,GB2312、GBK、GB18030 以及 UTF8 共同点是都兼容 ASICII 全角和半角字符 使用输入法输入字符的时候,有全角和半角之分,对于同一个字符,全角和半角对应的码点是不一样的 下面列出了一些字符的全角和半角的外观截图 半角是 ASICII 码中的字符,对应的编码范围是 0x00 - 0x7F,每个字符占一个字节 ...
GBK和GB2312都是双字节等宽编码,如果算上和ASCII兼容所支持的单字节,也可以理解为是单字节和双字节混合的变长编码。GB18030编码是变长编码,有单字节、双字节和四字节三种方式。 GB18030 的单字节编码范围是0x00-0x7F,完全等同于ASCII;双字节编码的范围和GBK相同,高字节是0x81-0xFE,低字节的编码范围是0x40 -0x...
前面提到从ASCII、GB2312、GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容,与GB码不兼容。例如“汉”字的Unicode编码是6C49,而GB码是BABA。 Unicode 在1990年开始研发,1994年正式公布。 2005年3月31日推出的Unicode 4.1.0。 2020年3月10日推出的Unicode 13.0.0。
GBK、GB2312--Unicode--UTF8 UTF8--Unicode--GBK、GB2312 对于⼀个⽹站、论坛来说,如果英⽂字符较多,则建议使⽤UTF-8节省空间。不过现在很多论坛的插件⼀般只⽀持GBK。GB2312是GBK的⼦集,GBK是GB18030的⼦集 GBK是包括中⽇韩字符的⼤字符集合 如果是中⽂的⽹站推荐GB2312 GBK...
GB 就是国标的意思,GB2312和GBK主要用于汉字的编码,而UTF-8是全世界通用的。意思就是说,如果你的网页主要面对使用汉语的中国人的话,使用GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK 作为网页编码的话,有些电脑上的浏览器没有这种编码,你的网页汉字...