DevOps研发效能
媒体矩阵
开源中国APP
授权协议 CC-BY-NC 4.0
开发语言 Python 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 应用工具多媒体工具
开源组织 Facebook
地区 不详
投 递 者 Alias_Travis
适用人群 未知
收录时间 2022-11-07

软件简介

EnCodec 是一个基于深度学习的音频编解码器,由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。

实现过程如下:

  • 首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);
  • 然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);
  • 最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;

安装

EnCodec 需要 Python 3.8 和 PyTorch 1.11.0,要安装 EnCodec,可以运行:

pip install -U encodec  # stable release
pip install -U git+https://git@github.com/facebookresearch/encodec#egg=encodec  # bleeding edge
# of if you cloned the repo locally
pip install .

使用

然后,可以使用 EnCodec 命令:

python3 -m encodec [...]
# or
encodec [...]
 
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
发表了资讯
2022/11/06 09:04

比 MP3 小 10 倍,Meta 公开全新音频压缩技术

Meta 近日在一篇题为 “High Fidelity Neural Audio Compression”(高保真神经音频压缩)的论文中公布了一项名为 "EnCodec" 的开源音频压缩技术,该技术由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。 Meta 将这项技术的实现方法分成了一个由三部分组成的系统,经过训练后的 AI 可以将音频压缩到所需的目标大小,其实现过程如下: 首先,编码器将未压缩的数据转换为较低帧率的 "l...

12
12
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
9 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部