DevOps研发效能
媒体矩阵
开源中国APP
授权协议 未知
开发语言 Python JavaScript
操作系统 跨平台
软件类型 开源软件
开源组织
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2025-05-06

软件简介

这个项目让你只需用语音就能与大语言模型 (LLM) 聊天,并近乎实时地接收语音回复。把它当成你自己的数字对话伙伴吧。

主要特点

  • 流畅的对话:说和听,就像真正的聊天一样。
  • 实时反馈:查看部分转录和 AI 响应。
  • 低延迟焦点:使用音频块流优化架构。
  • 智能轮流发言:动态静音检测(turndetect.py)可适应对话节奏。
  • 灵活的 AI 大脑:可插入的 LLM 后端(Ollama 默认,通过 OpenAI 支持llm_module.py)。
  • 可定制的声音:从不同的文本到语音引擎中进行选择(Kokoro、Coqui、Orpheus via audio_module.py)。
  • Web 界面:使用 Vanilla JS 和 Web Audio API 的干净、简单的 UI。
  • Dockerized 部署:建议使用 Docker Compose 进行设置,以便于依赖项管理。
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
暂无内容
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
1 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部