Google工程师将语言翻译变成向量空间数学问题

oschina
 oschina
发布于 2013年10月01日
收藏 33

现有的基于统计翻译的在线工具如巴比鱼和Google翻译,翻译的结果勉强可用,但离完美还相去甚远。现在,Google工程师在预印本网站上发表论文,介绍了一种不依赖于统计翻译的新技术。他们的方法是将语言翻译变成向量空间数学问题,利用数据挖掘技术建模一种语言的结构,然后与另一种语言的结构进行对比。

新 的方法是基于一个概念,即每一种语言都有一套相似的理念,因而使用单词的方式也存在相似性。例如,大多数语言中都有描述相同动物的单词,如狗、猫和牛,这 些单词很可能以相同的方式在句子中使用,如“猫是一种比狗小的动物”。语言中单词之间的关系集合被称为“语言空间”,可类比为一个点到另一个点的向量集 合,能以数学的方式进行处理,例如王减去男性加上女性等于女王(‘king’–‘man’+‘woman’=‘queen’)。在向量空间中,许多语言都 有共通之处,可以利用向量空间线性变换将一种语言翻译成另一种语言。Google工程师表示,新的方法非常有效。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:Google工程师将语言翻译变成向量空间数学问题
资讯来源:Solidot
加载中

最新评论(13

童学芬
童学芬
太强大了。难懂啊。
沙枣
沙枣
将一个比较复杂的问题转换成另外一个更加复杂的问题
Neeke
Neeke
king-man+woman=queen
wtony
wtony
如果最终能推导出“自然语言学之数学原理”,就像牛顿的“自然哲学之数学原理”一样,那就牛B了。
wtony
wtony
语言学之数学原理。
赵云30
赵云30
难怪翻译质量差到不行。
王政
王政
多维空间向量机啊……怎么看着仍然是SVM?这应该早已经成熟了吧
黑传说
黑传说
且,说到底还是利用统计啊,不然怎么知道 king-man+woman=queen 呢,只不过以前直接硬翻,现在多个条件而已,算法根本没变,故弄高深而已。
杨同学
杨同学
数学家改变世界
返回顶部
顶部