加载中

Mozilla Voice STT - Mozilla 语音文本引擎

Mozilla Voice STT 是开源的语音转文本(Speech-To-Text)引擎,使用基于百度 Deep Speech 研究论文的机器学习技术作为训练模型,并通过 TensorFlow...

收藏 9
更新于 2020/08/25

online_speech_recognition - 基于百度 SDK 在线语音识别工具

online_speech_recognition 是一个在线文字内容转音频文件的小工具,开发这个小工具的目的是可以把微信公众号文章转为mp3音频文件,然后插入自己的微信公众号文章中去,非常方便...

收藏 11

XunFeiNETSDK - 讯飞在线语音合成 SDK

讯飞在线语音合成(流式版)SDK。 这是一个讯飞在线语音合成的 sdk 源码,以及调用的 demo。 可以在 neget 包管理搜索 XunFeiNETSDK 安装。

收藏 10

roby-chatbot - 语音聊天机器人

一款完全本地化的,集语音识别、语义处理、语音合成的聊天机器人程序。 Roby-0.0 目前还是一个 demo,用于测试一些基本功能。它仅适用于 Linux。支持英语和中文。 演示视频: http...

收藏 9

Real-Time Voice Cloning - 5 秒克隆语音,实时生成任意语音

Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Spe...

收藏 270
更新于 2019/08/27

Taip - 调用腾讯 AI 接口的 Java 客户端

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前已经接入 【face人脸识别】 人脸检测与分析、多人脸检测、人脸对比、跨年龄人...

收藏 180
更新于 2018/11/07

Tacotron - 使用 TensorFlow 实现文字转语音

Tacotron 是完全端到端的文本到语音合成模型,主要是将文本转化为语音,使用了预训练模型(pre-trained)技术。 Tacotron 可利用文本生成类似真人的语音,建议安装 Pytho...

收藏 80
更新于 2018/03/31

Resonance Audio - 谷歌空间音频 SDK

Resonance Audio 是 Google 去年发布的空间音频 SDK,现在才得以开源,该技术利用位置数据和声音过滤器在 VR 或 AR 应用中提供定位准确逼真的环绕立体声效果。Googl...

收藏 8
更新于 2018/04/01

DeepSpeech - 端到端自动语音识别

DeepSpeech 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper。 我们...

收藏 65
更新于 2020/04/24

voice-web - 开源语音识别采集库

这是一个跨 Web、Android 和 iOS 的应用程序,用于收集针对 Project Common Voice 的语音捐赠。这是Mozilla Common Voice的网络应用程序,Moz...

收藏 28
更新于 2017/12/01

govpr - 声纹识别引擎

简介 govpr是golang 实现的基于 GMM-UBM 说话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,1...

收藏 92
更新于 2016/11/06

Speech_Evaluation_Recognition - 离线语音识别

离线语音识别,语音评测,支持中文,英文识别,中文,英文评价。(与讯飞百度等无关) 包含调用实例,接口说明,未混淆jar包。

收藏 39

Pocketsphinx.js - JavaScript 语音识别

Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 Java...

收藏 293
更新于 2016/05/20

meSpeak.js - JavaScript 的 TTS 库

meSpeak.js (speak.js 增强版) 是一个 100% 纯客户端 JavaScript 实现的 TTS 库,基于 speak.js 开发,在其基础上增加对 Webkit 和 Saf...

收藏 181
更新于 2019/08/12

VoixJS - JavaScript 语音命令库

Voix.JS 是一个 JavaScript 库,可为你的网站、应用和游戏增加了语音命令的功能,目前只支持 Chrome 浏览器。 示例代码: <script src="voix.js"></s...

收藏 147
更新于 2016/02/28
开源软件作者
TMS 作者
ProGit2 简体中文翻译 作者
EasyDefine 作者

Kaldi - 语音识别工具

Kaldi 是一个语音识别工具。使用 C++ 开发,基于 Apache 许可证。目的是为语音识别研究者提供。 Kaldi 的目标和受众范围与 HTK 相似。目标是用 C++ 编写的现代灵活的代码...

收藏 29

gendy - Web 音频随机合成模块

gendy 是一个 Web 音频随机合成模块。动态随机合成是由作曲家和理论家 Iannis Xenakis 首创的技术。 使用示例: 下载 gendy.js 文件,包含它到你的页面顶部的脚本标签...

收藏 0

ACAT - 语音通讯系统

ACAT (Assistive Context-Aware Toolkit ) 是 Intel 开源的语音通讯系统。 Assistive Context-Aware Toolkit (ACAT)...

收藏 38
更新于 2015/08/18

JuliusJS - JavaScript 语音识别库

JuliusJS 是实现了语音识别的 JavaScript 库。在线演示请点击介绍内容结束后的“软件首页”按钮。 示例: // bootstrap JuliusJS var julius = n...

收藏 256
更新于 2014/10/04

webvoice - 基于 Web 的 TTS 工具

webvoice 是一个 Web TTS 工具。

收藏 3

没有更多内容

加载失败,请刷新页面

返回顶部
顶部