Speech_Evaluation_Recognition 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Speech_Evaluation_Recognition 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票

软件简介

离线语音识别,语音评测,支持中文,英文识别,中文,英文评价。(与讯飞百度等无关) 包含调用实例,接口说明,未混淆jar包。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (2)

加载中
java里面能用吗
2019/08/29 11:49
回复
举报
哎,用不了
2019/02/14 16:21
回复
举报
更多评论
暂无内容
发表于硬件 & IoT专区
04/27 18:07

Alango - Speech Recognition Enhancement

穿戴和听力设备(wearable and hearable)设备需要永远在线(Always-on),这对于用户来说非常重要。我们不难想象出其重要性,比如外科医生(surgeon)在外科手术时佩戴智能眼镜,或者是建筑师在勘察施工现场的时候与电...

0
0
发表了博客
2019/04/10 18:58

EE 519: Speech Recognition and Processing for Multimedia

Out: Mar 30 2019 Due: Apr 13 2019 EE 519: Speech Recognition and Processing for Multimedia Spring 2019 Homework 5 There are 2 problems in this homework, with several questions. Please make sure to show the details of working for each question. Answers without any justification may not receive cre...

0
0
发表了博客
10/19 07:09

说说python自带的speech和speech_recognition的使用以及效果

人工智能这么火爆的时代,近来正好有时间就想研究以下智能语音这块的内容,虽然感觉自带的模块应该识别不太准确,不然就不会有百度的padder,google的tensorflow等框架,但是路要一步步走,饭也要一步步吃,初学的时候总要各种尝试一下。以下内容是我最近两天的尝试结果。 环境win10,python3.7 先说说speech,这个贼简单...

0
0
发表了博客
2019/07/16 21:33

第三篇:ASR(Automatic Speech Recognition)语音识别

ASR(Automatic Speech Recognition)语音识别:     百度语音--语音识别--python SDK文档:       https://ai.baidu.com/docs#/ASR-Online-Python-SDK/top     第三方模块:pip install baidu-aip     ASR_test.py 1 from aip import AipSpeech 2 import os 3 4 """ 你的 APPID AK SK """ ...

0
0
发表了博客
2018/08/04 20:30

State of the art speech recognition with sequence-to-sequence models

基于注意机制的编码解码结构例如LAS(Listen,Attention,Spell),将声学模型,发音模型和语言模型统一在一起,使得语音识别做到了端到端训练. 本文在LAS基础上,在建模结构和优化过程这两个方面做出了一些改进,从而显著地提升模型性能.建模结构方面,使用单词级别模型代替字母级别模型和使用multi-head attention. 优化过程方面...

0
0
发表了博客
2019/12/24 10:56

Python使用Speech_Recognition实现普通话识别

最近因学习任务,对语音识别需要了解,所以现在就把一些学习过程遇到的问题解决方法分享给大家。首先pyhon提供了许多语音识别库,大致包含: 上述语音识别软件库各个之间的侧重点不同,如:谷歌云语音侧重语音向文本转换,又如wit与apiai还提供超出基本语音识别的内置功能(识别讲话者意图的自然语言处理功能)。由于我仅...

0
0
发表了博客
2019/05/13 15:13

Robust CNN-based Speech Recognition With Gabor Filter Kernels

在这篇文章中,强调GCNN对噪声数据的稳健性,提出这一方法的初衷,与在特征层面上进行失配补偿的方法异曲同工,希望通过提取对噪声更加鲁棒的特征缓解数据之间的失配问题。 Abstract 在之前的研究当中,通过多层神经网络提取语音信号当中的声学特征信息。虽然这种方法取得了一定的效果,但是,在测试集和训练集数据不匹配...

0
0
发表了博客
2019/05/05 17:17

A Deep Neural Network Integrated with FilterBank Learning for Speech Recognition

本文主要对该论文中的关键点进行总结和梳理,不完全翻译整篇文章。 摘要 DNN的主要优势就是不需要人工提取语音信号当中的特征。**因此,我们在DNN的底部(输入部分)加上了一个pseudo-filterbank层,并且通过联合训练,对该层的参数和网络其他层的参数进行训练。**在现有的其他基于DNN的网络当中,一般取预先定义的Mel尺...

0
0
发表了博客
09/10 19:31

[未完成] Kaggle No.1:tensorflow-speech-recognition-challenge 题解

目录 语音识别以及可视化分析数据 0. 目的 1. 对输入的观察与可视化 1.1 Wave and spectrogram线性谱 1.2 Mel谱 1.3 MFCC 1.3 Silence removal 1.4 Resampling - dimensionality reduction 2. 特征提取......

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
2 评论
39 收藏
分享
返回顶部
顶部