软件简介

online_speech_recognition 是一个在线文字内容转音频文件的小工具,开发这个小工具的目的是可以把微信公众号文章转为mp3音频文件,然后插入自己的微信公众号文章中去,非常方便的转换小工具。采用C#开发语言基于Framework4.5开发,主要采用百度语音识别SDK,实现了在线文本转语音的功能,可以转换后直接播放。有需要的朋友可以下载学习一下。如果遇到问题的可以留言或者私信我。

软件架构

C#+visualStudio+C#百度语音SDK

使用说明

  1. 直接运行debug目录下的exe程序,双击就可以运行了

运行截图

主界面

保存文件

注意事项

使用的时候请登录百度开发者平台自行申请语音识别的SDK,相关的应用密钥。配置好就可以正常使用了。

百度语音识别

配置

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (1)

加载中
IT技术分享社区软件作者
04/18 08:53
回复
举报
更多评论
暂无内容
发表于硬件 & IoT专区
04/27 18:07

Alango - Speech Recognition Enhancement

穿戴和听力设备(wearable and hearable)设备需要永远在线(Always-on),这对于用户来说非常重要。我们不难想象出其重要性,比如外科医生(surgeon)在外科手术时佩戴智能眼镜,或者是建筑师在勘察施工现场的时候与电...

0
0
发表了博客
2019/04/10 18:58

EE 519: Speech Recognition and Processing for Multimedia

Out: Mar 30 2019 Due: Apr 13 2019 EE 519: Speech Recognition and Processing for Multimedia Spring 2019 Homework 5 There are 2 problems in this homework, with several questions. Please make sure to show the details of working for each question. Answers without any justification may not receive cre...

0
0
发表了博客
10/19 07:09

说说python自带的speech和speech_recognition的使用以及效果

人工智能这么火爆的时代,近来正好有时间就想研究以下智能语音这块的内容,虽然感觉自带的模块应该识别不太准确,不然就不会有百度的padder,google的tensorflow等框架,但是路要一步步走,饭也要一步步吃,初学的时候总要各种尝试一下。以下内容是我最近两天的尝试结果。 环境win10,python3.7 先说说speech,这个贼简单...

0
0
发表了博客
2019/07/16 21:33

第三篇:ASR(Automatic Speech Recognition)语音识别

ASR(Automatic Speech Recognition)语音识别:     百度语音--语音识别--python SDK文档:       https://ai.baidu.com/docs#/ASR-Online-Python-SDK/top     第三方模块:pip install baidu-aip     ASR_test.py 1 from aip import AipSpeech 2 import os 3 4 """ 你的 APPID AK SK """ ...

0
0
发表了博客
2018/08/04 20:30

State of the art speech recognition with sequence-to-sequence models

基于注意机制的编码解码结构例如LAS(Listen,Attention,Spell),将声学模型,发音模型和语言模型统一在一起,使得语音识别做到了端到端训练. 本文在LAS基础上,在建模结构和优化过程这两个方面做出了一些改进,从而显著地提升模型性能.建模结构方面,使用单词级别模型代替字母级别模型和使用multi-head attention. 优化过程方面...

0
0
发表了博客
2019/12/24 10:56

Python使用Speech_Recognition实现普通话识别

最近因学习任务,对语音识别需要了解,所以现在就把一些学习过程遇到的问题解决方法分享给大家。首先pyhon提供了许多语音识别库,大致包含: 上述语音识别软件库各个之间的侧重点不同,如:谷歌云语音侧重语音向文本转换,又如wit与apiai还提供超出基本语音识别的内置功能(识别讲话者意图的自然语言处理功能)。由于我仅...

0
0
发表了博客
2019/05/13 15:13

Robust CNN-based Speech Recognition With Gabor Filter Kernels

在这篇文章中,强调GCNN对噪声数据的稳健性,提出这一方法的初衷,与在特征层面上进行失配补偿的方法异曲同工,希望通过提取对噪声更加鲁棒的特征缓解数据之间的失配问题。 Abstract 在之前的研究当中,通过多层神经网络提取语音信号当中的声学特征信息。虽然这种方法取得了一定的效果,但是,在测试集和训练集数据不匹配...

0
0
发表了博客
2019/05/05 17:17

A Deep Neural Network Integrated with FilterBank Learning for Speech Recognition

本文主要对该论文中的关键点进行总结和梳理,不完全翻译整篇文章。 摘要 DNN的主要优势就是不需要人工提取语音信号当中的特征。**因此,我们在DNN的底部(输入部分)加上了一个pseudo-filterbank层,并且通过联合训练,对该层的参数和网络其他层的参数进行训练。**在现有的其他基于DNN的网络当中,一般取预先定义的Mel尺...

0
0
发表了博客
09/10 19:31

[未完成] Kaggle No.1:tensorflow-speech-recognition-challenge 题解

目录 语音识别以及可视化分析数据 0. 目的 1. 对输入的观察与可视化 1.1 Wave and spectrogram线性谱 1.2 Mel谱 1.3 MFCC 1.3 Silence removal 1.4 Resampling - dimensionality reduction 2. 特征提取......

0
0
发表了博客
2019/02/25 15:47

论文阅读笔记“Attention-based Audio-Visual Fusion for Rubust Automatic Speech recognition”

关于论文的阅读笔记 论文的题目是“Attention-based Audio-Visual Fusion for Rubust Automatic Speech recognition”,翻译成中文为 基于注意力的视听融合技术实现鲁棒自动语音识别 (这是用谷歌翻译的。。。。。) 摘要 文章介绍提出了一种音-视融合方案,这种方案超越了简单的特征融合,可以实现两种模式的自动对齐,...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
1 评论
11 收藏
分享
返回顶部
顶部