MMS 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
MMS 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
MMS 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 CC-BY-NC 4.0
开发语言 Python
操作系统 跨平台
软件类型 开源软件
开源组织 Facebook
地区 不详
投 递 者 白开水不加糖
适用人群 未知
收录时间 2023-05-23

软件简介

Massively Multilingual Speech (MMS) 是由 Meta 开源的一个 AI 语音识别模型。支持 1107 种语言的语音转文本和文本转语音,以及 4000 多种语言的语言识别。

MMS 项目将支持的语言数量增加了 10-40 倍,具体取决于任务。主要成分是一个新的数据集,该数据集基于对公开宗教文本的阅读,并有效地利用了自我监督学习。

项目团队构建了涵盖 1406 种语言的预训练 wav2vec 2.0 模型、1107 种语言的单一多语言自动语音识别模型、相同数量语言的语音合成模型,以及 4017 种语言的语言识别模型。实验表明,该多语言语音识别模型在 FLEURS 基准测试的 54 种语言上将 Whisper 的单词错误率降低了一半以上,同时在一小部分标记数据上进行了训练。

关于 MMS 所涵盖的语言的概述,可查看此处

预训练模型

Model Link
MMS-300M download
MMS-1B download

可以在此处找到微调预训练模型的示例命令。

微调模型

ASR

Model Languages Dataset Model Supported languages
MMS-1B:FL102 102 FLEURS download download
MMS-1B:L1107 1107 MMS-lab download download
MMS-1B-all 1162 MMS-lab + FLEURS
+ CV + VP + MLS
download download

TTS

  1. 下载 1107 种语言的 iso codes 列表。
  2. 找到目标语言的 iso code 并下载 checkpoint。每个文件夹包含 3 个文件:G_100000.pthconfig.jsonvocab.txt
# Examples:
wget https://dl.fbaipublicfiles.com/mms/tts/eng.tar.gz # English (eng)
wget https://dl.fbaipublicfiles.com/mms/tts/azj-script_latin.tar.gz # North Azerbaijani (azj-script_latin)

LID

# Languages Dataset Model Dictionary Supported languages
126 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
256 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
512 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
1024 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
2048 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
4017 FLEURS + VL + MMS-lab-U + MMS-unlab download download download
展开阅读全文

代码

评论

点击引领话题📣 发布并加入讨论🔥
发表了资讯
2023/05/25 08:33

Meta 开源大模型:支持 4000+ 语言识别,1100+ 种语音文本转换

Meta AI 团队宣布开源了一个名为 Massively Multilingual Speech (MMS) 的 AI 模型,声称可以识别 4000 多种语言,比目前已知技术要多 40 倍。以及扩展了文本转语音和语音转文本技术的涵盖范围,从大约 100 种语言到 1100 多种。 根据介绍,现有的最大的语音数据集最多只涵盖 100 种语言;因此为了收集数千种语言的音频数据,Meta 使用了一种非常规的方法 —— 宗教文本录音。“我们转向宗教文本(例如《圣经》),这些文本已被...

1
10
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
10 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部