加载中

GPT-SoVITS - 语音克隆与合成工具

GPT-SoVITS 是少样本语音转换与语音合成工具。仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆,若提供 1 分钟语音样本可以逼近真人的效果,且训练出高质量的 TTS 模...

收藏 9

EmotiVoice - 多音色提示控制 TTS 引擎

EmotiVoice(易魔声)是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 EmotiVo...

收藏 16
更新于 2023/11/15

Fyzhq - 发音转换器

发音转换器,可以将中文的发音对应到外语发音,以达到用外语说中文的效果。 如何使用? 输入想转换的文字,将得到的结果复制到谷歌翻译等网站即可得到发音。 谷歌翻译:https://translate...

收藏 0

Mocking Bird - 实时语音克隆

Mocking Bird 是一个实时语音克隆项目,可在 5 秒内克隆声音并生成任意语音内容。 特性 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata...

收藏 21

gTTS - 基于 Python 的文本转语音库

gTTS 是一个 Python 库和 CLI 工具,用于与 Google Translate 的 text-to-speech API 交互。 特征 可定制的特定于语音的句子标记器,允许阅读无限...

收藏 14
更新于 2023/01/25

MaryTTS - Java 编写的文本转语音系统

MaryTTS 是一个用纯 Java 写的文本转语音客户端服务器系统,因此可以在许多平台上运行。 运行 MaryTTS 运行./gradlew run 启动 MaryTTS 服务器。然后使用 W...

收藏 2

ASRT - 基于深度学习的中文语音识别系统

ASRT 是一个基于深度学习的中文语音识别系统,全称为 Auto Speech Recognition Tool。此项目使用 Keras、TensorFlow,基于深度卷积神经网络和长短时记忆神...

收藏 29
更新于 2021/09/04

Realtime-Voice-Clone-Chinese - AI 拟声

Realtime-Voice-Clone-Chinese 是一个 AI 拟声软件,可以在 5 秒内克隆你的声音并生成任意语音内容。是仅支持英语的 Real-Time-Voice-Cloning ...

收藏 12

Coqui TTS - 基于深度学习的文本转语音库

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经...

收藏 51
更新于 2021/09/01
Coqui TTS

XZVoice - 文字转语音

XZVoice是一款文字转语音软件,采用阿里语音引擎! 支持添加自定义阿里key 支持添加自定义背景音乐 支持Windows、Mac系统

收藏 7

Mozilla Voice STT - Mozilla 语音文本引擎

Mozilla Voice STT 是开源的语音转文本(Speech-To-Text)引擎,使用基于百度 Deep Speech 研究论文的机器学习技术作为训练模型,并通过 TensorFlow...

收藏 18
更新于 2020/08/25

online_speech_recognition - 基于百度 SDK 在线语音识别工具

online_speech_recognition 是一个在线文字内容转音频文件的小工具,开发这个小工具的目的是可以把微信公众号文章转为mp3音频文件,然后插入自己的微信公众号文章中去,非常方便...

收藏 14

XunFeiNETSDK - 讯飞在线语音合成 SDK

讯飞在线语音合成(流式版)SDK。 这是一个讯飞在线语音合成的 sdk 源码,以及调用的 demo。 可以在 neget 包管理搜索 XunFeiNETSDK 安装。

收藏 15

roby-chatbot - 语音聊天机器人

一款完全本地化的,集语音识别、语义处理、语音合成的聊天机器人程序。 Roby-0.0 目前还是一个 demo,用于测试一些基本功能。它仅适用于 Linux。支持英语和中文。 演示视频: http...

收藏 18

Real-Time Voice Cloning - 克隆语音并实时生成任意语音

Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Spe...

收藏 305
更新于 2021/02/05
开源软件作者
ER2K 作者
DBErp 作者
WuKong Search 作者

Taip - 调用腾讯 AI 接口的 Java 客户端

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前已经接入 【face人脸识别】 人脸检测与分析、多人脸检测、人脸对比、跨年龄人...

收藏 182
更新于 2018/11/07

Tacotron - 使用 TensorFlow 实现文字转语音

Tacotron 是完全端到端的文本到语音合成模型,主要是将文本转化为语音,使用了预训练模型(pre-trained)技术。 Tacotron 可利用文本生成类似真人的语音,建议安装 Pytho...

收藏 82
更新于 2018/03/31

Resonance Audio - 谷歌空间音频 SDK

Resonance Audio 是 Google 去年发布的空间音频 SDK,现在才得以开源,该技术利用位置数据和声音过滤器在 VR 或 AR 应用中提供定位准确逼真的环绕立体声效果。Googl...

收藏 8
更新于 2018/04/01

DeepSpeech - 端到端自动语音识别

DeepSpeech 是一个采用 PaddlePaddle 平台的端到端自动语音识别(ASR)引擎的开源项目,具体原理参考这篇论文 Baidu's Deep Speech 2 paper。 我们...

收藏 65
更新于 2020/04/24

voice-web - 开源语音识别采集库

这是一个跨 Web、Android 和 iOS 的应用程序,用于收集针对 Project Common Voice 的语音捐赠。这是Mozilla Common Voice的网络应用程序,Moz...

收藏 27
更新于 2017/12/01

没有更多内容

加载失败,请刷新页面

返回顶部
顶部