Facebook 开源语音识别工具包 wav2letter - 开源中国社区
Float_left Icon_close
Facebook 开源语音识别工具包 wav2letter
王练 2018年01月02日

Facebook 开源语音识别工具包 wav2letter

王练 王练 发布于2018年01月02日 收藏 38

阿里云高性能云服务器,2折起! >>> >>>  

Facebook AI 研究院近日开源了一款简单高效的端到端自动语音识别(ASR)系统 wav2letter,wav2letter 实现的是论文 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System 和 Letter-Based Speech Recognition with Gated ConvNets 中提出的架构。

Papers

@article{collobert:2016,
  author    = {Ronan Collobert and Christian Puhrsch and Gabriel Synnaeve},
  title     = {Wav2Letter: an End-to-End ConvNet-based Speech Recognition System},
  journal   = {CoRR},
  volume    = {abs/1609.03193},
  year      = {2016},
  url       = {http://arxiv.org/abs/1609.03193},
}

@article{liptchinsky:2017,
  author    = {Vitaliy Liptchinsky and Gabriel Synnaeve and Ronan Collobert},
  title     = {Letter-Based Speech Recognition with Gated ConvNets},
  journal   = {CoRR},
  volume    = {abs/1712.09444},
  year      = {2017},
  url       = {http://arxiv.org/abs/1712.09444},
}

如果你使用 wav2letter 或相关的预训练模型,需引用其中的一篇论文。 

另外,如果想要立刻进行语音转录的,Facebook 还提供了 Librispeech 数据集上预训练模型。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Facebook 开源语音识别工具包 wav2letter
分享
评论(1)
精彩评论
1
不知道是不是跟讯飞一样不可理喻。
最新评论
1
不知道是不是跟讯飞一样不可理喻。
顶部