DevOps研发效能
媒体矩阵
开源中国APP
授权协议 Apache-2.0
开发语言 C/C++ 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 应用工具多媒体工具
开源组织 Google
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2021-08-17

软件简介

Lyra 是一种高质量、低比特率的语音编解码器,即使在最慢的网络上也可以进行语音通信。为此,它应用了传统的编解码器技术,同时利用机器学习 (ML) 的进步和在数千小时数据上训练的模型来创建压缩和传输语音信号的新方法。

Lyra 的架构分为两部分,编码器和解码器。当有人对着手机说话时,编码器会从他们的语音中捕捉独特的属性。这些语音属性,也称为特征,以 40ms 为单位提取,然后压缩并通过网络发送。解码器的工作是将这些特征转换回音频波形,以便通过电话听筒播放出来。将特征解码回波形的过程是通过生成模型(Generative models)处理的,生成模型是一种特殊类型的机器学习模型,非常适合从有限的特征中重新创建一个完整的音频波形。Lyra架构与传统的音频编解码器非常相似,几十年来,传统的音频编解码器已经构成了互联网通信的主干。这些传统的编解码器是基于数字信号处理(DSP)技术,而 Lyra 的关键优势来自于生成模型重建高质量语音信号的能力。

Lyra 的代码是用 C++ 所编写的,以提高速度、效率和互操作性,使用 Bazel 构建框架和 GoogleTest 框架进行彻底的单元测试,并基于 Apache 许可协议进行分发。

 

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
发表了资讯
2021/08/18 06:17

Google 推出神经网络编解码器 SoundStream,将整合进开源项目 Lyra

Google 近日发布了一个端到端的神经音频编解码器 —— SoundStream。最重要的是,Google 表示这是世界上第一个由神经网络驱动并支持语音、音乐和环境声音等不同声音类型的音频编解码器,可以在智能手机的处理器上实时处理上述各种音频。 音频编解码器是压缩音频文件的基本工具,以使其体积更小,并在传输过程中尽可能节省时间。因此,音频编解码器对于流媒体、在线语音和视频通话这类有音频传输需求的服务而言至关重要。 虽然音...

0
8
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
6 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部