加载中

Taip - 调用腾讯 AI 接口的 Java 客户端

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前已经接入 【face人脸识别】 人脸检测与分析、多人脸检测、人脸对比、跨年龄人...

收藏 160
更新于 2018/11/07

Tacotron - 使用 TensorFlow 实现文字转语音

Tacotron 是完全端到端的文本到语音合成模型,主要是将文本转化为语音,使用了预训练模型(pre-trained)技术。 Tacotron 可利用文本生成类似真人的语音,建议安装 Pytho...

收藏 67
更新于 2018/03/31

Resonance Audio - 谷歌空间音频 SDK

Resonance Audio 是 Google 去年发布的空间音频 SDK,现在才得以开源,该技术利用位置数据和声音过滤器在 VR 或 AR 应用中提供定位准确逼真的环绕立体声效果。Googl...

收藏 5
更新于 2018/04/01

DeepSpeech - 百度 DeepSpeech 架构的 TensorFlow 实现

DeepSpeech 项目是一个开源的 Speech-To-Text 引擎。它基于百度深度语音研究论文的机器学习技术训练论文,使用 Google 的 TensorFlow 项目来简化实现。

收藏 14

voice-web - 开源语音识别采集库

这是一个 Web,Android 和 iOS 应用程序,用于收集针对 Project Common Voice 的语音捐赠。

收藏 21
更新于 2017/12/01

govpr - 声纹识别引擎

简介 govpr是golang 实现的基于 GMM-UBM 说话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,1...

收藏 85
更新于 2016/11/06

Speech_Evaluation_Recognition - 离线语音识别

离线语音识别,语音评测,支持中文,英文识别,中文,英文评价。(与讯飞百度等无关) 包含调用实例,接口说明,未混淆jar包。

收藏 33

Pocketsphinx.js - JavaScript 语音识别

Pocketsphinx.js 是一个在浏览器上通过纯 JavaScript 实现语音识别的功能,支持 Chrome 和 Firefox 浏览器。提供录音的功能。 特性: 100% 纯 Java...

收藏 286
更新于 2016/05/20

meSpeak.js - JavaScript 的 TTS 库

meSpeak.js (speak.js 增强版) 是一个 100% 纯客户端 JavaScript 实现的 TTS 库,基于 speak.js 开发,在其基础上增加对 Webkit 和 Saf...

收藏 173
更新于 2016/05/21

VoixJS - JavaScript 语音命令库

Voix.JS 是一个 JavaScript 库,可为你的网站、应用和游戏增加了语音命令的功能,目前只支持 Chrome 浏览器。 示例代码: <script src="voix.js"></s...

收藏 147
更新于 2016/02/28

Kaldi - 语音识别工具

Kaldi 是一个语音识别工具。使用 C++ 开发,基于 Apache 许可证。目的是为语音识别研究者提供。 Kaldi's versus other toolkits Kaldi is sim...

收藏 20

gendy - Web 音频随机合成模块

gendy 是一个 Web 音频随机合成模块。动态随机合成是由作曲家和理论家 Iannis Xenakis 首创的技术。 使用示例: 下载 gendy.js 文件,包含它到你的页面顶部的脚本标签...

收藏 0

ACAT - 语音通讯系统

ACAT (Assistive Context-Aware Toolkit ) 是 Intel 开源的语音通讯系统。 Assistive Context-Aware Toolkit (ACAT)...

收藏 35
更新于 2015/08/18

JuliusJS - JavaScript 语音识别库

JuliusJS 是实现了语音识别的 JavaScript 库。在线演示请点击介绍内容结束后的“软件首页”按钮。 示例: // bootstrap JuliusJS var julius = n...

收藏 255
更新于 2014/10/04

webvoice - 基于 Web 的 TTS 工具

webvoice 是一个 Web TTS 工具。

收藏 3
开源软件作者
lemann
pinyin4j 作者
张慧华
Dwz_group 作者
闲大赋
Beetl 作者

AISEntry - 开源的PC、Andriod文本朗读软件

AISEntry的目标是建立一个自然沟通方式的Android程序或ROM,目标是实现人工智能在产品上的集成。不过,目前先以服务用户,方便使用为目的,利用讯飞语音+,实现使用Android端程序本...

收藏 15
更新于 2014/06/12

Gespeaker - espeak​ 的 GTK+ 前端

Gespeaker 是 espeak 的 GTK+ 前端。它允许用户用多种语言播放一个文本,可以设置语音,音高,音量和播放速度,这个文本同样可以记录成 WAV 文件。Gespeaker 支持 语...

收藏 2

CMU Sphinx - 语音识别系统

CMU Sphinx 是一个语音识别系统,包含一个 libsphinx2 库和一些小的实例。

收藏 46
更新于 2013/11/15

eSpeak for Android

eSpeak for Android 是 eSpeak 的 Android 移植版本,支持 75 种语言和方言

收藏 25
更新于 2014/06/08

rtc - 开源的网络实时语音视频框架

基于 Google 开源的 WebRTC 的音频和视频核心引擎(也即原来的 GIPS, Global IP Sound)开发的开源语音和视频框架, 包含服务器和客户端两部分, 可用于开发类似YY...

收藏 61

没有更多内容

加载失败,请刷新页面

返回顶部
顶部