Tacotron 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Tacotron 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票

软件简介

Tacotron 是完全端到端的文本到语音合成模型,主要是将文本转化为语音,使用了预训练模型(pre-trained)技术。

Tacotron 可利用文本生成类似真人的语音,建议安装 Python 3 版本。

使用 pre-trained 模型

下载和解压模型

curl http://data.keithito.com/data/speech/tacotron-20170720.tar.bz2 | tar xjC /tmp

运行 demo server

python3 demo_server.py --checkpoint /tmp/tacotron-20170720/model.ckpt

访问 localhost:9000

输入你想要合成的东西

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (1)

加载中
hgw
打分: 很差
这篇文章写的根本就是错误百出
2018/04/29 21:14
回复
举报
更多评论
暂无内容
发表了博客
2019/08/30 16:15

Tacotron-2 实验记录

Try the Std Version 1. Get Tacotron-2-master.zip from https://github.com/Rayhane-mamah/Tacotron-2 2.Unzip Tacotron-2-master.zip on Unbuntu 3.Terminal: cp -r training_data ./Tacotron-2 #tra......

0
0
发表了博客
2019/12/23 21:29

基于Tacotron模型的语音合成实践

Tacotron模型架构图 (1) 下载tacotron模型的实现到本地,这里是基于GitHub上一个tacotron模型的实现开展研究的,GitHub网址:https://github.com/keithito/tacotron,由于 谷歌没有给出tacotron模型的官方实现,这里给出了tacotron模型的非官方实现; 1) 研究是在linux下开展的,由于源码较多,只展示tacotron模型源码的...

0
0
发表了博客
2019/08/28 13:18

语音识别:从 WaveNet 到 Tacotron,再到 RNN-T

从 WaveNet 到 Tacotron,再到 RNN-T 谷歌再获语音识别新进展:利用序列转导来实现多人语音识别和说话人分类 雷锋网 AI 科技评论按:从 WaveNet 到 Tacotron,再到 RNN-T,谷歌一直站在语音人工智能技术的最前沿。近日,他们又将多人语音识别和说话人分类问题融合在了同一个网络模型中,在模型性能上取得了重大的突破。 ...

0
0
发表了博客
2019/11/12 10:16

tensorboard的使用(以Tacotron-1-car20为例)

目录 调用 数据 PROJECTOR scalar 代码 调用 在有envent的地方: tensorboard --logdir=./ --host=0.0.0.0 --port=8880 数据 PROJECTOR PROJECTOR用于将高维向量进行可视化,通过PCA,T-SNE等方法将高维向量投影到......

0
0
发表了博客
04/13 09:41

基于Tacotron汉语语音合成的开源实践

2017年初,Google 提出了一种新的端到端的语音合成系统——Tacotron。Tacotron打破了各个传统组件之间的壁垒,使得可以从<文本,声谱>配对的数据集上,完全随机从头开始训练。本文是来自喜马拉雅FM音视频工程师马...

0
0
发表了博客
2019/11/01 14:48

Tacotron-1严格复现CUHK-Mix-Language论文

We clip gradients when their global norm ex-ceeds 1 and use parallel-mode monotonic attention with initial en-ergy function scalar bias set to -1. https://www.tensorflow.org/versions/r1.15/api_docs......

0
0
发表了博客
2019/11/12 10:17

语音信号处理在Tacotron实战代码中的应用

目录 理论 FFT 理论 FFT 等回学校再弄吧. 看老师的ppt.

0
0
发表了博客
11/16 10:32

Speaker Encoder建模音色联合Tacotron训练TTS

-1. 说明 Tacotron组里发表的建模方式, 平安实习这边去年也有同学尝试过 参考核心论文: 2018-核心-Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis 参考Git项目 http......

0
0
发表了博客
11/11 16:27

ResCNN Encoder建模音色联合Tacotron训练TTS

-1. 说明 咱们使用speaker embedding的时候, 可以有两种用法, 一种是one-hot 然后映射到embedding空间, 同一个说话人所有句子共用一个embedding; 第二种是对每句话进行变长序列到embedding的encode, 比如speaker...

0
0
发表了博客
2019/09/20 18:26

Tacotron-2-google-full-structure 以及 过程中产生的灵感

1. speaker id 和 language id 放的位置: The synthesizer network uses the Tacotron 2 architecture [20], with additional inputs consisting of learned speaker (64-dim) and language embeddings (3-dim),......

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
1 评论
81 收藏
分享
返回顶部
顶部