DELTA 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
DELTA 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
DELTA 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
DELTA 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
DELTA 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台 DELTA,以进一步帮助 AI 开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力 NLP 应用更好落地。

DELTA 主要基于 TensorFlow 构建,能同时支持 NLP(自然语言处理)和语音任务及数值型特征的训练,整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。

用户准备好模型训练数据,并指定好配置 Configuration,模型训练 pipeline 可以根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。在训练结束之后,自动生成模型文件保存。该模型文件形成统一接口,可以直接上线使用,快速产品化,能让从研究到生产变得更容易。

值得注意的是,除可支持多种模型的训练,DELTA 还支持灵活配置,开发者可基于 DELTA 搭建成多达几十种的复杂的模型;此外,DELTA 在多种常用任务上提供了稳定高效的 benchmark,用户可以简单快速的复现论文中的模型的结果,同时也可以在此基础上扩展新的模型。在模型构建完成后,用户可以使用 DELTA 的部署流程工具,迅速完成模型上线。从论文到产品部署无缝衔接。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
2020/10/19 20:51

Dive into Delta Lake | Delta Lake 尝鲜

点击上方蓝色字体,选择“设为星标” 回复”资源“获取更多资源 大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 大数据真好玩 点击右侧关注,大数据真好玩! Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间的乐观并发控制(optimistic concurrency control),在写入数据期间提供一致性的读取,从而为构建在 HDFS 和云存储上的数据湖(data lakes)带来...

0
0
发表了博客
2020/06/06 10:56

didi出品 夜莺

http://n9e.didiyun.com/docs/install/compile/

0
0
2019/11/18 18:41

delta-lake 系列(二)-delta lake

#delta lake 简介 当我们的主流架构模型依托HATP的时候,我们的数据来源因为hadoop的存在而变得更加旷阔,例如在我们公司,目前的数据源有kafka、aws kinesis、 第三方数据api、aws s3文件、elasticsearch 各种数据、服务日志文件、前端snowplow数据买点、系统运维数据、数据metrics等,随着数据源的越来越多,我们同时也会面临行业内大家同时都会面对的一些问题: 1. 数据湖的读写是不可靠的。我们的数据经常会出现脏写脏读等情...

0
0
2020/08/31 20:38

数据工程师眼中的 Delta lake(Delta by example)

SPARK+AI SUMMIT 2020中文精华版线上峰会带领大家一起回顾2020年的SPARK又产生了怎样的最佳实践,技术上取得了哪些突破,以及周边的生态发展。本文中Databricks开源组技术主管范文臣从数据工程师的角度出发向大家介绍Delta Lake。以下是视频内容精华整理。 原视频链接:https://developer.aliyun.com/live/43189?spm=a2c6h.12873639.0.0.4eca1a518KlgJ5 活动链接:SPARK中文峰会议题(三)|听听砖厂和领英工程师说的吧 一、Del...

0
0
2020/07/24 10:49

数据工程师眼中的 Delta lake(Delta by example)

SPARK+AI SUMMIT 2020中文精华版线上峰会带领大家一起回顾2020年的SPARK又产生了怎样的最佳实践,技术上取得了哪些突破,以及周边的生态发展。本文中Databricks开源组技术主管范文臣从数据工程师的角度出发向大家介绍Delta Lake。以下是视频内容精华整理。 原视频链接:https://developer.aliyun.com/live/43189?spm=a2c6h.12873639.0.0.4eca1a518KlgJ5 活动链接:SPARK中文峰会议题(三)|听听砖厂和领英工程师说的吧 一、Del...

0
0
2019/11/19 11:20

delta-lake 系列— delta对比hudi

hudi原是uber开发的hoodie项目,贡献给apache后,改名为hudi,从表面功能上来看看,于delata相比,两者都作为一个数据存储层来处理出现的数据湖的各种问题,比如准实时数据更新等。下面我们具体来对比一下两者的一些区别 功能及设计| hudi |delta| :---:|:-----:|:-----: 设计出发点| 解决upsert问题,不支持数据版本,无法支持并发读写,不存在锁机制| 解决upsert问题,数据版本回滚,提供乐观锁机制,支持数据并发读写 设计策...

0
0
2019/08/05 14:00

another delta upload in CRM side

Created by Wang, Jerry, last modified on Dec 14, 2014 (/hsJABAP Debugger(1) (Exclusive)-HTTP(dailgdd QDD_24)Step Size DWatchpoint Layout Configure Debugger Laye 自CL-IM BBP-PROD BU UPD-=/ CLIM BBP PRODBU UPD==/ 29 SY-SUBRC 0METHOD /IF-EX_COM PRODMNTUPD-CHANGE AFTER UPDATE SY-TAEIX   Desktop 1 Desktop 2 Desktop 3StandardStructure TablesObjectsDetailDpisplay Data Explore Break.jWatchpointsDiff...

0
0
发表于软件架构专区
2020/02/05 14:39

Delta元数据解析

作者:宋军,花名嵩林,阿里云EMR技术专家。从事Spark内核优化,对SparkCore/SprakSQL有深入了解,Spark Contributor Delta元数据解析 元数据初识 Delta有自己的元数据管理,主要有6种类型的元数据Action: SetTransaction AddFile RemoveFile Metadata Protocol CommitInfo Delta的元数据统一存放在Delta的logpath下面的_delta_log文件夹中 _delta_log文件夹位置 不管DeltaTable是分区表还是非分区表,_delta_log文件夹只有一个...

0
0
2019/12/02 19:33

Delta元数据解析

作者:宋军,花名嵩林,阿里云EMR技术专家。从事Spark内核优化,对SparkCore/SprakSQL有深入了解,Spark Contributor Delta元数据解析 元数据初识 Delta有自己的元数据管理,主要有6种类型的元数据Action: SetTransaction AddFile RemoveFile Metadata Protocol CommitInfo Delta的元数据统一存放在Delta的logpath下面的_delta_log文件夹中 _delta_log文件夹位置 不管DeltaTable是分区表还是非分区表,_delta_log文件夹只有一个...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
21 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部