DevOps研发效能
媒体矩阵
开源中国APP
加载中

SurfSense - 可定制的 AI 研究代理

SurfSense 是可定制的 AI 研究代理,可作为 NotebookLM 或 Perplexity 的开源替代方案,支持连接外部来源,如搜索引擎(Tavily、LinkUp)、Slack、L...

收藏 1

Spark-TTS - 基于 LLM 的文本转语音模型
国内精选

Spark-TTS是基于LLM的高效文本转语音模型,让语音合成更自然、更高效。 亮点特性 零样本文本到语音的无缝转换,无需额外训练 支持中英双语,轻松实现跨语言合成 可控语音生成,可调节音色、语...

收藏 0

GibberLink - AI 语音模式切换工具

GibberLink 是让 AI 对话从语言切换到特殊音频协议的工具,实现更高效、更隐秘的交流。 GibberLink 的原理是通过音频在两个设备之间传输数据。据称这种语言工具的交流效率比英语更...

更新于 2025/02/26
收藏 1

Fideo - 开源直播录制工具
国内精选

Fideo 是开源的直播录制工具,基于 React、ffmpeg、Electron、Shadcn、FRP 实现,支持监控直播,可以帮助用户简单便捷地对直播进行录制,并保存为 MP4 格式的视频。...

收藏 1

AudioNotes - 基于大模型的音视频转结构化笔记系统
国内精选

AudioNotes 是基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统,能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的 Markdown 笔记,方便快速阅读...

收藏 3

Amphion - 语音生成整合工具包
国内精选

Amphion 是开源的音频、音乐和语音生成整合工具包。 主要特性 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张...

收藏 2

GPT-SoVITS - 语音克隆与合成工具
国内精选

GPT-SoVITS 是少样本语音转换与语音合成工具。仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆,若提供 1 分钟语音样本可以逼近真人的效果,且训练出高质量的 TTS 模...

收藏 14

EmotiVoice - 多音色提示控制 TTS 引擎
编辑推荐
国内精选

EmotiVoice(易魔声)是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 EmotiVo...

更新于 2023/11/15
收藏 18

Fyzhq - 发音转换器
国内精选

发音转换器,可以将中文的发音对应到外语发音,以达到用外语说中文的效果。 如何使用? 输入想转换的文字,将得到的结果复制到谷歌翻译等网站即可得到发音。 谷歌翻译:https://translate...

收藏 0

Mocking Bird - 实时语音克隆
国内精选

Mocking Bird 是一个实时语音克隆项目,可在 5 秒内克隆声音并生成任意语音内容。 特性 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata...

收藏 21

gTTS - 基于 Python 的文本转语音库

gTTS 是一个 Python 库和 CLI 工具,用于与 Google Translate 的 text-to-speech API 交互。 特征 可定制的特定于语音的句子标记器,允许阅读无限...

更新于 2023/01/25
收藏 14

MaryTTS - Java 编写的文本转语音系统

MaryTTS 是一个用纯 Java 写的文本转语音客户端服务器系统,因此可以在许多平台上运行。 运行 MaryTTS 运行./gradlew run 启动 MaryTTS 服务器。然后使用 W...

收藏 2

ASRT - 基于深度学习的中文语音识别系统
国内精选

ASRT 是一个基于深度学习的中文语音识别系统,全称为 Auto Speech Recognition Tool。此项目使用 Keras、TensorFlow,基于深度卷积神经网络和长短时记忆神...

更新于 2021/09/04
收藏 30

Realtime-Voice-Clone-Chinese - AI 拟声
国内精选

Realtime-Voice-Clone-Chinese 是一个 AI 拟声软件,可以在 5 秒内克隆你的声音并生成任意语音内容。是仅支持英语的 Real-Time-Voice-Cloning ...

收藏 12

Coqui TTS - 基于深度学习的文本转语音库
编辑推荐

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经...

更新于 2021/09/01
收藏 51
Coqui TTS
开源软件作者
oss-server 作者
AliceCodeCreator 作者
joytur 作者

XZVoice - 文字转语音
国内精选

XZVoice是一款文字转语音软件,采用阿里语音引擎! 支持添加自定义阿里key 支持添加自定义背景音乐 支持Windows、Mac系统

收藏 8

Mozilla Voice STT - Mozilla 语音文本引擎

Mozilla Voice STT 是开源的语音转文本(Speech-To-Text)引擎,使用基于百度 Deep Speech 研究论文的机器学习技术作为训练模型,并通过 TensorFlow...

更新于 2020/08/25
收藏 18

online_speech_recognition - 基于百度 SDK 在线语音识别工具
国内精选

online_speech_recognition 是一个在线文字内容转音频文件的小工具,开发这个小工具的目的是可以把微信公众号文章转为mp3音频文件,然后插入自己的微信公众号文章中去,非常方便...

收藏 14

XunFeiNETSDK - 讯飞在线语音合成 SDK
国内精选

讯飞在线语音合成(流式版)SDK。 这是一个讯飞在线语音合成的 sdk 源码,以及调用的 demo。 可以在 neget 包管理搜索 XunFeiNETSDK 安装。

收藏 15

roby-chatbot - 语音聊天机器人
国内精选

一款完全本地化的,集语音识别、语义处理、语音合成的聊天机器人程序。 Roby-0.0 目前还是一个 demo,用于测试一些基本功能。它仅适用于 Linux。支持英语和中文。 演示视频: http...

收藏 18

没有更多内容

加载失败,请刷新页面

返回顶部
顶部