例如,UTF-8表示以8位(一个字节)为一个代码单元,而UTF-8编码可以包含1到4个字节;UTF-16表示以16位(两个字节)为一个代码单元,而UTF-16编码可包含2或4个字节。这两种编码方案都是“变长”的,即编码所包括的字节数可变;但对于UTF-32,其自身以32位为一个代码单元,单单一个字节已可以容纳所有字符了。因此UTF...
也就是说,在UTF-16编码方式中,编号字符集CCS中的字符编号与字符编码方式CEF中的字符编码不再仅仅是简单的直接映射关系。 具体来说,就是Unicode字符集基本平面BMP中的字符(大致相当于UCS字符集中的UCS-2字符,但必须除开U+D800~U+DFFF这一在Unicode字符集BMP中称之为代理码点的部分),仍然是直接映射关系,亦即这部...