HTK 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
HTK 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票

软件简介

HTK(Hidden Markov Model Toolkit) 是一个便携工具包,可用于构建和控制隐藏的 Markov 模型。

展开阅读全文

评论 (2)

加载中
Kaldi
2019/01/27 04:55
回复
举报
CMU Sphinx
2019/01/27 04:34
回复
举报
更多评论
暂无内容
发表了博客
2014/01/29 13:37

基于HTK的语音拨号系统

基于 HTK 的语音拨号系统 Veket NWPU 2011-6-22 目标: 该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词( sub-word,eg.. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。 内容: 1. 数据准备 (1) ...

0
0
2013/03/09 02:17

windows下安装编译HTK语音识别工具包

在找BOSS聊了之后,终于放弃了文档指导灰常少的CMU SPHINX,开始研究HTK工具包,进行一系列的语音相关的工作。最近这几天一直都在看HTKBOOK,今天准备一边进行windows下安装和编译HTK库,一边把这其中的过程记录下来,跟大家一起分享。 HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的...

10
66
发表了博客
2018/11/20 13:48

Ubuntu 16.04安装下HTK--亲测ok

1、首先需要安装一些32位库 sudo apt-get install libx11-dev:i386 libx11-dev sudo apt-get install g++-multilib sudo apt-get install osspd 2.下载HTK src和samples http://htk.eng.cam.ac.uk/(测试可行版本为3.4.1) 3.解压,进入解压后的文件夹 ./configure --prefix=/to/path 改为自己想安装的位置;例如./confi...

0
0
2015/11/21 12:48

Ubuntu14.04环境下安装编译HTK语音识别工具库

本文主要介绍了Ubuntu14.04环境下安装编译HTK语音识别工具库的过程。

0
2
2013/03/11 16:51

Linux下安装编译并且测试HTK语音识别库

今天晚上又来了兴致,决定写一个linux下的HTK的安装和测试,如果有人想看windows下的,可以看我之前的那篇博文。 首先前提是要确保自己安装了g++和libx11 sudo apt-get install libx11-dev:i386(libX11.so) 解压HTK-3.4.1.tar.gz sudo tar xzf HTK-3.4.1.tar.gz 然后: sudo ./configure --prefix=/usr/local/ 出现: se...

5
42
发表了博客
2013/03/23 00:39

基于HTK语音工具包进行孤立词识别的使用教程

1前言 最近一直在研究HTK语音识别工具包,前几天完成了工具包的安装编译和测试,这几天又按耐不住好奇,决定自己动手搞一搞,尝试一下用这个工具包,进行简单的孤立词识别,看了几天的文档,做了各种尝试,总算跌跌撞撞的实现了,把步骤记录下来,以后作为参考。 2孤立词识别系统 在本系统中我们将要实现三个词的识别系统...

10
35
发表了博客
04/01 11:37

HTK 3.5解码工具HVITE独立工程(Visual Studio Code实现)

HTK3.5支持DNN HTK3.5支持DNN了,本来想做一个HMM+DNN的模型,作为HMM+GMM的对比。但是HTK不支持实时的HMM+DNN解码。原因有两个。 HTK不支持实时的计算MFCC_0_D_A_Z的特征,即无法实时计算出特征空间的均值。 HTK不支持实时的DNN或者HMM+DNN的解码。 所以只能做离线的演示。为了学习HVITE的细节,我决定将HVITE工具单独编...

0
0
发表了博客
2019/04/03 20:22

语音识别ASR - HTK(HResults)计算字错率WER、句错率SER

HResults计算字错率(WER)、句错率(SER) 前言 好久没发文,看到仍有这么多关注的小伙伴,觉得不发篇文对不住。确实好久没有输出经验总结相关的文档,抽了个时间,整理了下笔记,发一篇关于ASR常用测试指标。比如字错率、句错率指标,以及计算工具HResults的使用篇,后续慢慢找时间输出一些人工智能领域,小白可理解可用的...

0
0
发表了博客
2019/08/22 13:34

ASR测试方法---字错率(WER)、句错率(SER)统计

一、基础概念 1.1、语音识别(ASR) 语音识别(speech recognition)技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR), 狭隘一点白话说:将语音转换为文字的技术。 维基百科: https://zh.wikipedia.org/wiki/语音识别 Findyou:一般使用ASR缩写。 1.2、句错率(SER) 句错误率:Sentence Error Ra...

0
0
发表了博客
2014/01/06 23:40

Kaldi语音识别库linux环境下的安装和编译

介绍: Kaldi语音识别库可以说是,HTK数据库的整理加强版,将HTK比较零碎的各种各样的指令和功能进行整理,使用更加的方便,同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成。 kaldi官方网站请见:http://kaldi.sourceforge.net/index.html 安装以及编译: 第一步:下载kaldi工具包 kaldi 有...

1
5
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2016/05/13 17:31

能不能从录音文件里提取语音特征,再做个性化语音合成

诸位 语音分析处理等相关领域的高人, 我实在有事相求, 现在只能广发此求助信,希望能得到些许帮助。 现在我手上只有若干个语音文件(wav), 我老婆生前留下来的, 简单的来说, 就是想要三岁的孩子,以后还能听到妈妈的声音, 孩子叫妈妈, 妈妈会答应一声, 再奢望一点,就是孩子能和妈妈 能简单的对话, 让孩子感觉...

8
0
发表了问答
2012/07/24 21:20

调整音频模型以实现更好的语音识别

处理一个准备不充足的音频模型可能会令人感到沮丧,特别是对于语音识别领域的初学者,他们习惯使用自己的口音相关模型。不像键盘和鼠标输入那样行动相对比 较积极且易于操作系统解释,将音频输入到语音识别器就不那么积极了,严重依赖音频模型的广度和深度。编程人员可以通过提供工具来简化分析识别错误过程。一 个合理的...

1
4
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
2 评论
26 收藏
分享
返回顶部
顶部