端到端自动语音识别 DeepSpeech

Apache-2.0
C/C++ Python 查看源码»
跨平台
百度
2017-12-01
周其

DeepSpeech 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper。 我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

基于OpenVINO的多输入model optimizer(Tensorflow)

Step I:下载预训练模型 wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deepspeech-0.3.0-models.tar.gz | tar xvfz - 文件内容如下 StepII:利用tensorflow中的...

2019/05/14 17:26
47
0
Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification M...

基于因子分解的隐层变量学习,应用于短语句语种识别模型的自适应 LFVs(Language Feature Vectors,语种特征向量)[11],与BSVs(Bottleneck Speaker Vectors)类似,即瓶颈特征 3.1. 神经元...

2018/06/07 20:35
41
0
语音识别中的标注问题和嵌入式训练

什么是嵌入式训练(Embedded Training)? 序列的标注问题 机器学习的问题主要分为三类:分类问题,标注问题和回归问题 标注问题的输入是一个观测序列,输出是一个标记序列或者状态序列。标注问...

2018/06/08 15:52
30
0
深度梯度压缩:减小分布式训练的通信带宽

论文:https://arxiv.org/pdf/1712.01887.pdf 译文:深度梯度压缩:减小分布式训练的通信带宽 摘要 大规模分布式训练需要通信带宽用于梯度交换,这在节点较多时,限制了训练的可扩展性,而且...

2019/08/30 15:28
28
0
自然语言处理领域重要论文&资源全索引

自然语言处理(NLP)是人工智能研究中极具挑战的一个分支。随着深度学习等技术的引入,NLP领域正在以前所未有的速度向前发展。但对于初学者来说,这一领域目前有哪些研究和资源是必读的?最近...

2019/03/25 23:59
23
0

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部