Live Transcribe Speech Engine 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Live Transcribe Speech Engine 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
Live Transcribe Speech Engine 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
Live Transcribe Speech Engine 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
Live Transcribe Speech Engine 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

Live Transcribe 是一款 Android 应用程序,可为失聪或有听力障碍的人提供实时字幕。此存储库包含用于与 Live Transcribe 中使用的 Google Cloud Speech API 进行通信的 Android 客户端库。

自动语音识别(ASR)模块具有以下功能:

  • 无限流媒体
  • 支持 70 多种语言
  • 文字不会丢失,只会延迟
  • 即使网络已经停电数小时,也会重新连接。当然,没有连接就不能进行语音识别。
  • 可以轻松启用和配置 Opus、AMR-WB、FLAC 编码
  • 包含文本格式库,用于可视化 ASR 置信度、发言人 ID 等
  • 可离线模型扩展
  • 内置支持语音检测器,可在延长静音期间用于停止 ASR 以节省资金和数据(请注意,未提供语音检测器实现)
  • 内置支持扬声器识别,可根据扬声器编号标记或着色文本(请注意,未提供扬声器识别实现)

提供的库几乎与生产应用程序 Live Transcribe 中运行的库相同。它们经过了广泛的现场测试和单元测试。但是,测试本身目前尚未开源。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
发表于AI & 大数据专区
2019/08/18 08:15

谷歌开源实时语音转录引擎 Live Transcribe Speech Engine

昨日,谷歌在其开源博客中宣布开源 Android 语音识别转录工具 —— Live Transcribe 的语音引擎(Live Transcribe Speech Engine),它旨在将语音或对话实时转录为文字,还能够为听障人士提供帮助。 Live Transcribe 是谷歌于今年 2 月推出的一款 Android 应用程序,它的语音识别由谷歌最先进的 Cloud Speech API 提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟的鲁棒性等等都带来一些考验。因此,...

7
41
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表于程序人生专区
2019/08/27 13:47

谷歌开源 Android语音引擎—Live Transcribe

Live Transcribe语音引擎是Google开源的 Android语音识别转录工具,可以将语音或对话实时转录为文字,也能为听障人士提供帮助。Live Transcribe 早在今年2月就已经推出,语音识别由谷歌的Cloud Speech API提供。但谷歌表示依赖于云对于网络连接、数据成本和延迟增加了复杂度和不确定性。因此,谷歌把Live Transcribe 的语音引擎开源出来,鼓励开发人员搭建服务并进一步开发和完善Live Transcribe语音引擎。Live Transcribe 语音...

0
1
2020/12/22 19:11

azure-cognitiveservices-speech--

azure-cognitiveservices-speech-- 发布:2020-12-22 19:11:16.850733 作者: ### 作者邮箱: ### 首页: ### 文档:None ### 下载链接 Copy from pypi.org 查询时间:3.187ms 渲染时间:3.31ms 本文同步分享在 博客“zhenruyan”(other)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。...

0
0
发表了博客
2020/03/19 20:04

Now available in Amazon Transcribe: Automatic Redaction of Personally Identifiable Information

https://amazonaws-china.com/blogs/aws/now-available-in-amazon-transcribe-automatic-redaction-of-personally-identifiable-information/ Launched at AWS re:Invent 2017, Amazon Transcribe is an automatic speech recognition (ASR) service that makes it easy for AWS customers to add speech-to-text capabilities to their applications. At the time of writing, Transcribe supports 31 languages, 6 of which c...

0
0
发表了博客
2020/03/19 20:25

Now available in Amazon Transcribe: Automatic Redaction of Personally Identifiable Information

https://amazonaws-china.com/blogs/aws/now-available-in-amazon-transcribe-automatic-redaction-of-personally-identifiable-information/ Launched at AWS re:Invent 2017, Amazon Transcribe is an automatic speech recognition (ASR) service that makes it easy for AWS customers to add speech-to-text capabilities to their applications. At the time of writing, Transcribe supports 31 languages, 6 of which c...

0
0
发表了博客
2019/06/01 11:02

一篇来自hasura graphql-engine 百万级别live query 的实践

转自:https://github.com/hasura/graphql-engine/blob/master/architecture/live-queries.md Scaling to 1 million active GraphQL subscriptions (live queries) Hasura is a GraphQL engine on Postgres that provides instant GraphQL APIs with authorization. Read more at hasura.ioand on github.com/hasura/graphql-engine. Hasura allows 'live queries' for clients (over GraphQL subscriptions). For example, a f...

0
0
发表了博客
2018/06/07 22:09

Speech语音播报

System.Speech 这个命名空间,报可以阅读文字和播放音频. 环境 W10 VS2017 CMMT 1.添加程序集引用 System.Speech 2.实例化播音类,并且播放一个文本 SpeechSynthesizer speech = new SpeechSynthesizer(); // 语速[-10,10] this.speech.Rate = -2 // 音量[0,100] //this.speech.Volume = 100 // 播放当前时间 string nowtime = DateTime.Now.ToString("yyyy年MM月dd日HH点mm分"); // 这里使用异步播放. 同步播放时,会卡死...

0
0
发表了博客
2014/08/25 21:16

1071 Speech Patterns

模拟题 1: map默认就是按照key排序的 2:添加元素时,可以直接map[string]++; #include <stdio.h> #include <string> #include <iostream> #include <map> using namespace std; map<string,int> m; int main(){   freopen("in.txt","r",stdin);   char c;   string str;   bool ignoreNonCha = true;//首位 或者 前一个字符为非字符数字时,不用将str放进map   while(scanf("%c",&c)!=EOF){                if((c >= ...

0
0
发表了博客
2019/12/26 11:43

Speech Bandwidth Extension With WaveNet

利用WAVENET扩展语音带宽 作者:Archit Gupta, Brendan Shillingford, Yannis Assael, Thomas C. Walters 博客地址:https://www.cnblogs.com/LXP-Never/p/12090929.html 博客作者:凌逆战 摘要   大规模的移动通信系统往往包含传统的通信传输信道,存在窄带瓶颈,从而产生具有电话质量的音频。在高质量的解码器存在的情况下,由于网络的规模和异构性,用现代高质量的音频解码器来传输高采样率的音频在实践中是很困难的。本文...

0
0
发表了博客
2014/07/15 09:49

work to live, or live to work

周末,本应睡觉的,却醒得这么早。 趴在床上看看新闻,打打字。

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
29 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部