Google有不少宏伟的计划,比如图书数字化和无人驾驶汽车,而其字体计划Noto却鲜有人关注。一般来说,如果系统不支持某种语言,就会显示一个空白的方框,国外一般将它称为“豆腐”(Tofu),而Noto就是“No Tofu”的缩写,旨在统一全世界语言的字体,消灭乱码。
前不久,Google联合Adobe推出的泛亚字体——思源黑体,它适用于中文、日文和韩文,就是Google Noto项目的一部分。Google似乎往前迈出了一步,但想要统一字体,还有很多困难。
编码问题
字体统一计划最早可追溯到1987年,当时Unicode联盟发起了一项语言字体研究,并在后来推出了Unicode标准,一套支持多语言处理和显 示的字符编码系统。Unicode会为每种语言的每一字符提供唯一的编号,称为码点(code point)。Google的Noto也与Unicode标准相兼容。
Unicode在统一汉字的过程中就遇到过困难,它想为中日韩共用的字符创建一个单一的字符库,不过当时技术条件不允许,而且码点很快就用完了,这 对想统一世界语言的计划来说,是一个很大的打击。而且,即便中日韩的汉字看起来很相近,但他们却代表了不同的文化模式,有很多细微的差别。统一的字符集会 造成拼写混乱。
不过技术在进步,现在同一字符的变形不必再使用同一编码,Noto也是第一个真正支持中日韩三国汉字的开源字体。
小语种问题
Noto支持的语言很多,即便是一些濒临灭绝的语言,如因纽特语(Inuktitut),也在其射程范围。这让很多使用着几乎被世人遗忘的语言的人感到很欣慰。
Tlingit一种濒临灭绝的印第安语言。这种语言还算幸运,因为它使用拉丁字母表进行书字。Noto的拉丁字体就能支持Tlingit,不过也仅仅是部分。许多词汇要加注变音符号,书字时要加以区别,但Noto现在这方面做的还不够多。
有趣的是,除了一些快灭绝的语言,Noto还支持一些古怪而有趣的语言字体,比如萧伯纳字母(shavian alphabet),《魔戒》作者托尔金所创制的架空文字。不过被数百万人使用的另一种印度语Oriya却不在其中,也让很多人感到不满。
字体不能反应文化背景
另一种情况是,即使Noto支持某种语言,其字体也不能准确反应出语言背后的文化。乌尔都语(Urdu)就是一个例子。
nastaliq体的乌尔都语书写华丽不规则,有很多古老的诗集都是用这种字体写成,被认为是乌尔都语的精髓,但并不受Noto支持。而naskh 体的乌尔都语则线条分明有规律,编码起来很简单,也因此包括在Noto中。这让很多人感到不满,因为系统中的文字并不能真正反映当地的使用情况,而不少人 在分享相关文本时,也不能直接复制粘贴,只能以图片的形式传送。
乌尔都语的情况与汉字当时的情况相反,前者是需要多个编码对应一个字符(有文体区别),而后者是试图用一个编码代表多个字符。类似的情况还有中文的草书、行书、楷书等,这都需要更进一步的研究。
Google的字体计划是一个不断调整与妥协的过程,要兼职美观与功能性有很大的难度。不过语言文字是人类社会的重要组成部分,多花一些时间也是值得的。
引用来自“ak_birdofprey”的评论
这种自然进化的统一比那种专制统一要温柔的多。要不秦始皇统一六国也不会那么快被推翻引用来自“李文轩”的评论
被推翻的又不是始皇,是胡亥赵高。如果扶苏正常继位,蒙恬辅之,就不会被推翻。
某些人习惯翻墙出去,但是自己又没完整的世界观,现在给洋人洗脑洗的开始一见到统一专制字眼就不爽了。
不用武力做后盾,怎么可能有希望和平统一,请那两位洗地的举出历史给大家看看!
引用来自“sevk”的评论
这种自然进化的统一比那种专制统一要温柔的多。要不秦始皇统一六国也不会那么快被推翻引用来自“ak_birdofprey”的评论
这种自然进化的统一比那种专制统一要温柔的多。要不秦始皇统一六国也不会那么快被推翻引用来自“Serval”的评论
已经有文泉驿了引用来自“小电阻Sofire”的评论
文泉驿可以死了引用来自“一刀”的评论
此话怎讲。一直用这个。引用来自“坚慧”的评论
可能比文泉译字符全,文泉译很多生僻字没弄好,而且由于多人制作水平不一,风格没那么统一美观引用来自“Serval”的评论
已经有文泉驿了引用来自“小电阻Sofire”的评论
文泉驿可以死了引用来自“一刀”的评论
此话怎讲。一直用这个。引用来自“viper_sir”的评论
这个字体 我用了一下 不好看引用来自“晰清”的评论
不好吗引用来自“viper_sir”的评论
这个字体 我用了一下 不好看引用来自“KevinJen”的评论
google有这闲功夫,搞个国产操作系统嘛引用来自“赵占涛”的评论
GOOGLE的国产,是哪国的国产啊引用来自“KevinJen”的评论
google有这闲功夫,搞个国产操作系统嘛引用来自“Serval”的评论
已经有文泉驿了引用来自“小电阻Sofire”的评论
文泉驿可以死了引用来自“一刀”的评论
此话怎讲。一直用这个。引用来自“胖纸囧”的评论
讲字体怎么还延伸到了字符编码?和统一编码消除乱码有啥关系?这个文章的中心点是啥子?引用来自“KevinJen”的评论
google有这闲功夫,搞个国产操作系统嘛引用来自“Serval”的评论
已经有文泉驿了引用来自“小电阻Sofire”的评论
文泉驿可以死了引用来自“Bing-L”的评论
字体和字体编码是一回事?引用来自“Bing-L”的评论
字体样式和字符编码是一回事?引用来自“Serval”的评论
已经有文泉驿了引用来自“Bing-L”的评论
字体和字体编码是一回事?