1、GBK是中国标准版GB2312编码的升级版。GBK编码是用来解决中文汉子的编码,是占用两个字节。不论中英文都是两个字节的,一般用十六进制表示的比较多一些。2、UTF-8编码是用来解析发送世界上多地国际的语言编码,它对英文和阿拉伯数字使用一个字节,中文三个字节编码。3、GBK包含全部中文字符;UTF8则包含全世界所有...
GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。 至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 GBK和UTF-8文字编码的区别: ...
GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。 简单概况就是: UTF-8英文1字节中文3字节,在编码效率和编码安全性之间做了平衡,适合网络传输,是理想的中文编码方式. GBK英文1字节(半角1字节,全角2字节),中文2字节,GBK的范围比GB2312广,GBK兼容GB2312。 参考文章: http://blog...
UTF-8就是在互联网上使用最广的一种unicode的实现方式,这是为传输而设计的编码,并使编码无国界,这样就可以显示全世界上所有文化的字符了。UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,当字符在ASCII码的范围时,就用一个字节表示,...
总结:1、GBK(国标扩展)属于国家编码,使用受局限性,utf8通用性好。2、UTF-8属于国际编码,通用性好,就算外国人用英文浏览器也能显示中文,而无需安装IE的中文语言支持包。3、GBK编码中文(英文)占2字节,utf8编码中文占三字节,英文占1个字节,GBK编码要比UTF-8编码节约数据空间。注意事项 开心大发现,...
UTF-8编码 由于Unicode比较浪费网络和硬盘资源,因此为了解决这个问题,就在Unicode的基础上,定制了一套编码规则(将「码位」转换为字节序列的规则【编码/解码 可以理解为 加密/解密 的过程】),这个新的编码规则就是UTF-8。UTF-8采用1-4个字符进行传输和存储数据,是一种针对Unicode的可变长度字符编码,又称万国码。
GBK与UTF-8是指的字符编码的两种形式--字符集。一般中文显示用GBK编码,但国外访问者访问的时候,如果浏览器不支持自动转码,用其它格式查看的时候会乱码。相比UTF-8,UTF-8是国际通用字符集,但是会多占一点点空间,因为语种非常多,要考虑兼容性。这两种编码集没有好坏之分,只有适用不适用的区别。
比如,简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示 256 x 256 = 65536 个符号。 中文编码的问题比较复杂,将在文末讨论。这里先了解下,虽然都是用多个字节表示一个符号,但是GB类的汉字编码与后文的 Unicode 和 UTF-8 是毫无关系的。 6、Unicode 正如上一节所说,世界...
台湾)无需安装简体中文支持,就能正常看您的文字,并且不会出现乱码,通常网络传输也是使用UTF-8编码。UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛;而GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便。