加载中

Fyzhq - 发音转换器

发音转换器,可以将中文的发音对应到外语发音,以达到用外语说中文的效果。 如何使用? 输入想转换的文字,将得到的结果复制到谷歌翻译等网站即可得到发音。 谷歌翻译:https://translate...

收藏 0

Mocking Bird - 实时语音克隆

Mocking Bird 是一个实时语音克隆项目,可在 5 秒内克隆声音并生成任意语音内容。 特性 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata...

收藏 19

gTTS - 基于 Python 的文本转语音库

gTTS 是一个 Python 库和 CLI 工具,用于与 Google Translate 的 text-to-speech API 交互。 特征 可定制的特定于语音的句子标记器,允许阅读无限...

收藏 14
更新于 2023/01/25

MaryTTS - Java 编写的文本转语音系统

MaryTTS 是一个用纯 Java 写的文本转语音客户端服务器系统,因此可以在许多平台上运行。 运行 MaryTTS 运行./gradlew run 启动 MaryTTS 服务器。然后使用 W...

收藏 0

ASRT - 基于深度学习的中文语音识别系统

ASRT 是一个基于深度学习的中文语音识别系统,全称为 Auto Speech Recognition Tool。此项目使用 Keras、TensorFlow,基于深度卷积神经网络和长短时记忆神...

收藏 29
更新于 2021/09/04

Realtime-Voice-Clone-Chinese - AI 拟声

Realtime-Voice-Clone-Chinese 是一个 AI 拟声软件,可以在 5 秒内克隆你的声音并生成任意语音内容。是仅支持英语的 Real-Time-Voice-Cloning ...

收藏 12

Coqui TTS - 基于深度学习的文本转语音库

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经...

收藏 50
更新于 2021/09/01
Coqui TTS

XZVoice - 文字转语音

XZVoice是一款文字转语音软件,采用阿里语音引擎! 支持添加自定义阿里key 支持添加自定义背景音乐 支持Windows、Mac系统

收藏 8

Mozilla Voice STT - Mozilla 语音文本引擎

Mozilla Voice STT 是开源的语音转文本(Speech-To-Text)引擎,使用基于百度 Deep Speech 研究论文的机器学习技术作为训练模型,并通过 TensorFlow...

收藏 18
更新于 2020/08/25

online_speech_recognition - 基于百度 SDK 在线语音识别工具

online_speech_recognition 是一个在线文字内容转音频文件的小工具,开发这个小工具的目的是可以把微信公众号文章转为mp3音频文件,然后插入自己的微信公众号文章中去,非常方便...

收藏 14

XunFeiNETSDK - 讯飞在线语音合成 SDK

讯飞在线语音合成(流式版)SDK。 这是一个讯飞在线语音合成的 sdk 源码,以及调用的 demo。 可以在 neget 包管理搜索 XunFeiNETSDK 安装。

收藏 15

roby-chatbot - 语音聊天机器人

一款完全本地化的,集语音识别、语义处理、语音合成的聊天机器人程序。 Roby-0.0 目前还是一个 demo,用于测试一些基本功能。它仅适用于 Linux。支持英语和中文。 演示视频: http...

收藏 18

Real-Time Voice Cloning - 克隆语音并实时生成任意语音

Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Spe...

收藏 305
更新于 2021/02/05

Taip - 调用腾讯 AI 接口的 Java 客户端

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前已经接入 【face人脸识别】 人脸检测与分析、多人脸检测、人脸对比、跨年龄人...

收藏 184
更新于 2018/11/07

Tacotron - 使用 TensorFlow 实现文字转语音

Tacotron 是完全端到端的文本到语音合成模型,主要是将文本转化为语音,使用了预训练模型(pre-trained)技术。 Tacotron 可利用文本生成类似真人的语音,建议安装 Pytho...

收藏 82
更新于 2018/03/31
开源软件作者
知雨天气 作者
We_Questionnaire 作者
f2e-server 作者

Resonance Audio - 谷歌空间音频 SDK

Resonance Audio 是 Google 去年发布的空间音频 SDK,现在才得以开源,该技术利用位置数据和声音过滤器在 VR 或 AR 应用中提供定位准确逼真的环绕立体声效果。Googl...

收藏 9
更新于 2018/04/01

DeepSpeech - 端到端自动语音识别

DeepSpeech 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper。 我们...

收藏 66
更新于 2020/04/24

voice-web - 开源语音识别采集库

这是一个跨 Web、Android 和 iOS 的应用程序,用于收集针对 Project Common Voice 的语音捐赠。这是Mozilla Common Voice的网络应用程序,Moz...

收藏 28
更新于 2017/12/01

govpr - 声纹识别引擎

简介 govpr是golang 实现的基于 GMM-UBM 说话人识别引擎(声纹识别),可用于语音验证,身份识别的场景. 目前暂时仅支持汉语数字的语音,语音格式为wav格式(比特率16000,1...

收藏 93
更新于 2016/11/06

Speech_Evaluation_Recognition - 离线语音识别

离线语音识别,语音评测,支持中文,英文识别,中文,英文评价。(与讯飞百度等无关) 包含调用实例,接口说明,未混淆jar包。

收藏 40

没有更多内容

加载失败,请刷新页面

返回顶部
顶部