中国电信发布首个支持 30 种方言混说语音大模型

来源: 投稿
2024-05-26 10:32:52

中国电信人工智能研究院(TeleAI)于近日发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。

据悉,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,研发团队采用的“蒸馏+膨胀”联合训练算法可解决超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,实现1B参数80层模型稳定训练。

中国电信方面表示,星辰语音大模型是业内首个开源的、基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率大幅降低。

据中国电信方面透露,星辰语音大模型现已对外开源及应用落地,在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用。通过接入星辰大模型,智能客服能够迅速理解30种方言,日均处理电话量达到约200万通,极大地提高了服务效率和用户体验。

展开阅读全文
点击加入讨论🔥(12) 发布并加入讨论🔥
本篇精彩评论
我认为大概率是客服电话录音,这部分录音既贴合实际,又不容易引发各种纠纷。放着历年积累的客服录音不用,监听就为了训练?
2024-05-27 09:22
2
举报
那是你想多了。
2024-05-27 09:22
1
举报
12 评论
2 收藏
分享
返回顶部
顶部