在某篇文章里,说码元是字符的编码存储在计算机中产生出的概念,换句话说,在UTF-16中,如果某个字符用了16bits的一个整数来映射,在保存时,它就需要消耗2个bytes,因此code unit = 2。 同理,如果是需要使用2个16bits的一个整数映射了某字符,那么该字符的code unit =4。 但是,在UTF-16的WIKI中,有这样一句: ...
UTF-16中码元和Unicode编号值之间的计算公式取决于字符是否位于基本多语言平面(BMP)或增补平面。在BMP中...