DeepSpeech 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
DeepSpeech 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
DeepSpeech 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
DeepSpeech 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
DeepSpeech 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

DeepSpeech 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper。 我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。

下载安装命令

## CPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle

## GPU版本安装命令
pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
暂无内容
发表了博客
2020/04/16 09:59

PaddlePaddle/DeepSpeech

语音识别: DeepSpeech2 English DeepSpeech2是一个采用PaddlePaddle平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文Baidu's Deep Speech 2 paper。 我们的愿景是为语音识别在工业应用和学术研究上,提供易于使用、高效和可扩展的工具,包括训练,推理,测试模块,以及 demo 部署。同时,我们还将发布一些预训练好的英语和普通话模型。 目录 安装 开始 数据准备 训练模型 数据增强流水线 推断和评价 在 Do...

0
0
发表了博客
2019/05/14 17:26

基于OpenVINO的多输入model optimizer(Tensorflow)

Step I:下载预训练模型 wget -O - https://github.com/mozilla/DeepSpeech/releases/download/v0.3.0/deepspeech-0.3.0-models.tar.gz | tar xvfz - 文件内容如下 StepII:利用tensorflow中的summarize_graph对fronzen后的网络结构进行可视化 首先执行如下语句:得到大致的输入输出信息 bazel-bin/tensorflow/tools/graph_transforms/summarize_graph --in_graph="/home/gsj/mutil_input/models/output_graph.pb" --print_struct...

0
0
发表了博客
2018/06/07 20:35

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification M...

基于因子分解的隐层变量学习,应用于短语句语种识别模型的自适应 LFVs(Language Feature Vectors,语种特征向量)[11],与BSVs(Bottleneck Speaker Vectors)类似,即瓶颈特征 3.1. 神经元调制 由于说话人特性的变化反映在语音信号中,因此将表示说话人适应声学特性的特征拼接到特征中。如VTLN或fMLLR,是直接对声学特征进行操作的自适应方法。可以训练一个说话人自适应系统以基于说话人属性直接对输入特征进行转换,这样效果...

0
0
发表了博客
2020/05/11 15:58

机器学习丨15个最流行的GitHub机器学习项目

来源:数据Seminar 本文约3800字,建议阅读7分钟。 本文列出了 2017 年 GitHub 平台上最为热门的知识库,其中包含了学习资料与工具。 GitHub 是计算机科学领域最为活跃的社区,在 GitHub 上,来自不同背景的人们分享越来越多的软件工具和资源库。在其中,你不仅可以获取自己所需的工具,还可以观看代码是如何写成并实现的。 作为一名机器学习爱好者,作者在本文中列出了 2017 年 GitHub 平台上最为热门的知识库,其中包含了学习...

0
0
发表了博客
2018/06/08 15:52

语音识别中的标注问题和嵌入式训练

什么是嵌入式训练(Embedded Training)? 序列的标注问题 机器学习的问题主要分为三类:分类问题,标注问题和回归问题 标注问题的输入是一个观测序列,输出是一个标记序列或者状态序列。标注问题的一个目标是训练一个模型,使它能够对观测序列给出标记序列和状态序列。 常用的统计学习方法: 隐马尔科夫模型,条件随机场。 在信息提取和自然语言处理中,标记问题是常见的基本问题。 如何标注 在进行语音识别的时候,我们不知道语...

0
0
发表了博客
2020/12/16 10:10

无性能损失,不用更改代码,Lightning 1.1版本发布,切分训练新功能节省50%以上内存 - 知乎

继 1.0.0 版本推出不到两个月的时间,grid.ai CEO、纽约大学博士 William Falcon 创建的 PyTorch Lightning 于近日宣布推出 1.1 版本。新版本新增了 sharded training 功能,在多 GPU 上训练深度学习(DL)模型时可以节省 50% 以上的内存,并且没有性能损失,也不需要更改代码。 机器之心报道,作者:杜伟、陈萍。 与 Facebook Research 的 FairScale 团队一道,PyTorch Lightning 团队在 1.1 版本中推出了 Sharded Training b...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
0 评论
66 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部