Unicode 14 标准发布

来源: OSCHINA
编辑: 局长
2021-09-18

Unicode 近日宣布了 14.0 版本的标准,其中包括核心规范、附件和数据文件。此版本新增 838 个字符,共计达 144697 个字符。新增内容还包括 5 个新脚本,目前共计 159 个脚本,最后还增加了 37 个新的 emoji 表情符号。

Unicode 官方中文名称为统一码,是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。

14.0 版本中的新脚本和字符增加了对波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦和菲律宾的现代语言组以及非洲和北美的其他语言的支持,包括:

  • 阿拉伯文字,包括用于古兰经的敬语和字符,以及用于书写非洲、巴尔干、南亚和东南亚语言的字符
  • 历史上的维特库其 (Vithkuqi) 字母,曾经用来书写阿尔巴尼亚语,当前正对其进行现代复兴
  • 坦撒 (Tangsa) 字母:用于书写坦撒语,在印度和缅甸使用
  • 托托 (Toto) 字母:用于编写印度东北部托托语的字母
  • 为扩展 IPA 添加了许多拉丁文脚本

此版本新增加了 37 个表情符号字符, 包括几个用于情感和手势的新表情符号(笑脸、手势、 动物和自然、食物和饮料、交通和活动)。

14.0 版更新了五个重要的 Unicode 附件:

更新了三个重要的 Unicode 规范:

Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。

详情查看发布公告

展开阅读全文
12 收藏
分享
加载中
精彩评论
再怎么烂至少也解决了不同文字的兼容问题,不然一个国家搞一套编码,根本就是乱了套,我们国家有GBK,GB2312,港澳台用BIG5,日本是SHIFT-JIS,韩国是EUC_KR,俄罗斯是KOI8-R,欧美那边用的是ISO-8859-1,而现在只需要统一用utf-8就都能解决了,所以unicode是一个伟大的发明
2021-09-18 18:31
17
举报
啥时候把滑稽进入啊
2021-09-19 03:12
5
举报
把这里的script翻译成脚本感觉怪怪的,unicode里的script是指一套文字体系
2021-09-18 11:28
5
举报
早上没发言,让你中午把话抢着说了。
nnicode就是西方人搞得一堆犬句尸米,用西方字母思维来理解所有文字系统。因为他们自己根本没有文字,仅仅是次生文明的“记录语言的符号”而已。本质上同日本假名。
真正的符号系统,应该是让人能方便的扩充和创造字符的。是全域表达的,是符合人类文明演化路径,高低兼容的。
是从用树枝在泥胚上刻画和使用计算机视觉处理都能支持的。
2021-09-18 13:27
4
举报
unicode很好用,再也没有乱码了
2021-09-22 13:26
2
举报
最新评论 (28)
还是评论区能学到东西。
2021-09-24 09:51
0
回复
举报
整那么多黑人元素 作甚。
2021-09-24 09:40
0
回复
举报
emoji表情还是让中国来设计吧,连个滑稽都没有
2021-09-23 19:20
0
回复
举报
应该可以向unicode提案吧
2021-09-23 20:44
0
回复
举报
现在加字挺难的,要先在委员会混熟,不然都没人给你审核,然后要在提案里写好一大堆可信的证据证明这个表情,然后那群人有灵活的程序正义判断标准来判断这个证据会不会被采纳。。。
2021-09-24 09:00
0
回复
举报
Unicode的问题是,位于加州的Unicode委员会基本把持着Unicode的话语权,以至于Unicode在搞emoji时逐渐成为利益集团的永久性宣传工具,而且每个地区的话语权地位不均等,某些地区的历史糟粕(如某些合字)长期霸占宝贵的码位的同时,一些地区的历史性兼容字符却被长期否决(例如来自于KPS 9566的某些字符),一些地区放弃支持本土的编码标准的同时,也可能逐步失去自己的话语权。即使现在的编码转换技术已经非常成熟的情况下。
2021-09-23 19:12
1
回复
举报
主要是这是个由商业公司组成的商业组织,国内不是商业公司在搞编码,机构提案是提给ISO,日本起码有富士之类的公司可以直接提。
2021-09-24 09:09
0
回复
举报
你确定中国的商业公司没搞过编码?GB2312那些国标你以为是zf憋出来的吗
2021-09-26 18:28
0
回复
举报
没有。
2021-09-27 08:42
0
回复
举报
您好,请问Windows系统的文件的名称用GBK编码的吗?拉文件到Linux为什么不会出现乱码?
2021-09-23 10:01
0
回复
举报
文件本身并不包含自身的名称信息,名称是存在文件系统结构内的,复制工具(也就是你这里提到的拉文件所用的工具)会根据相应的文件系统来创建相同名称的文件,至于会不会乱码,也就看“复制工具“是怎么实现的了。
2021-09-23 14:04
0
回复
举报
啥时候把滑稽进入啊
2021-09-19 03:12
5
回复
举报
unicode就是一套稀烂方案。要全套支持就是个灾难。
2021-09-18 11:31
0
回复
举报
早上没发言,让你中午把话抢着说了。
nnicode就是西方人搞得一堆犬句尸米,用西方字母思维来理解所有文字系统。因为他们自己根本没有文字,仅仅是次生文明的“记录语言的符号”而已。本质上同日本假名。
真正的符号系统,应该是让人能方便的扩充和创造字符的。是全域表达的,是符合人类文明演化路径,高低兼容的。
是从用树枝在泥胚上刻画和使用计算机视觉处理都能支持的。
2021-09-18 13:27
4
回复
举报
大哥哥,你觉得该怎么设计呢
2021-09-19 12:02
2
回复
举报
我没那多道理。这个大杂汇,就是旧时代的代表作--撒都支持,撒都支持的不到位。
2021-09-22 11:19
0
回复
举报
"他们自己根本没有文字",却发明出了计算机
2021-09-26 09:08
0
回复
举报
这两件事有关系吗?
如果你说有关系,
那么我说,没有活字印刷术,他们就不可能发明计算机,对不对?
2021-10-13 16:00
0
回复
举报
再怎么烂至少也解决了不同文字的兼容问题,不然一个国家搞一套编码,根本就是乱了套,我们国家有GBK,GB2312,港澳台用BIG5,日本是SHIFT-JIS,韩国是EUC_KR,俄罗斯是KOI8-R,欧美那边用的是ISO-8859-1,而现在只需要统一用utf-8就都能解决了,所以unicode是一个伟大的发明
2021-09-18 18:31
17
回复
举报
Unicode和ISO8859-1 是兼容的
2021-09-19 22:32
0
回复
举报
只吹不写的代表。
2021-09-22 11:15
0
回复
举报
unicode很好用,再也没有乱码了
2021-09-22 13:26
2
回复
举报
是的,这是他进步的地方,需要肯定。
但是不是因为这样,他就没有毛病了。
就像古代用画像代替拍照一样,并不是说有了画画就不用照相机了。有了牛顿三大定律就不需要相对论了。
他是进步,但是有更好的进步需求不是何理的吗?
2021-10-13 16:04
0
回复
举报
把这里的script翻译成脚本感觉怪怪的,unicode里的script是指一套文字体系
2021-09-18 11:28
5
回复
举报
有几个表情是受中国互联网影响的?
2021-09-18 11:00
0
回复
举报
就那个身份证的看着像,其他的跟中国互联网也没啥关系呀,身份证那个还没截
2021-09-18 11:35
0
回复
举报
比心这个手势 国外也用的多?
2021-09-20 10:08
0
回复
举报
比心这个手势分两次从外国传到国内,早前是代表钱的手势,后来韩国偶像团体发明了比心的说法又一次传到了国内。
2021-09-22 09:10
1
回复
举报
更多评论
28 评论
12 收藏
分享
返回顶部
顶部