开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
THUMT首页、文档和下载 - 神经机器翻译工具包 - 开源中国社区
全部项目分类
我要评价
BSD
Python
跨平台
分享
收藏
40 人收藏
收录时间:2017-06-22
THUMT 详细介绍

THUMT 是由清华大学自然语言处理组开发的数据驱动机器翻译系统。

机器翻译是一种自然语言处理任务,其目的是使用计算机自动翻译自然语言。近几年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流。

THUMT 是用于神经机器翻译的开源工具包,构建于 Theano 之上,具有以下特点:

  • 基于 Attention 的翻译模型。 THUMT 应用了标准的 attention 编码器-解码器框架。

  • 最低风险训练。除了标准最大似然估计(MLE)之外,THUMT 还支持最小风险训练(MRT),其目的是找到一组模型参数,以最小化使用训练数据评估指标(如 BLEU)计算的预期损失。

  • 使用单一语言语料库:THUMT 为 NMT 提供了半监督训练(SST)能力,能够利用丰富的单语语料库资源来改善源-目标和目标-源 NMT 模型的学习。

  • 可视化。为了更好地了解 NMT 的内部工作,THUMT 提供了一个可视化工具来演示每个中间状态与其相关语境之间的相关性。


大家对 THUMT 的评论 (全部 2 条评论)
{{repayCom.userName}}
smf
聘请外国人做的吗?清华出品咋不提供中文资料 惠及更多国人
市民杨汝士
可以把神经病语言转化成正常语言
顶部