关于 Unicode 字符编码的疑问

我_承宇 发布于 2016/11/04 14:41
阅读 125
收藏 0

最早对 Unicode 字符集进行编码采用的是 UCS-2,只能对 65536 个字符进行编码,后来空间不足搞了 UTF-16。把字符分成17个平面。其中BMP平台对应以前UCS-2编码的字符,范围是 0x0000 ~ 0xFFFF。

但是,在BMP中,0xD800 ~ 0xDFFF 之间的空间是被留来映射辅助平面字符的。那么问题就来了,既然你让BMP对应以前UCS-2里的字符,那么现在留了2048个空间出来它用,那么这些位置上的字符在UTF-16的编码方案下去哪里了呢?

虚心求教!@红薯

加载中
返回顶部
顶部