UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,当字符在ASCII码的范围时,就用一个字节表示,保留了ASCII字符一个字节的编码做为它的一部分,注意的是unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节)。从unicode到uft-8并不...
ASCII => GB2312 => GBK=>gb18030 => ISO-8859-1(Unicode)(latin-1) => UTF-8(Unicode) 从ASCII码谈起 ASCII码:16384个字符。这就是ANSI字符标准。英文一个字节,中文两个字节。 早期计算机(美国人造的),用ASCII编码(一个字节,8位,可以表示256个编码,实际英语世界里字母、数字和常用符号完全够用) 但是...
UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,当字符在ASCII码的范围时,就用一个字节表示,保留了ASCII字符一个字节的编码做为它的一部分,注意的是unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节)。从unicode到uft-8并不...