加载中

PaddleSpeech - 基于飞桨的语音开源模型库

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型。 特性: 本项目采用了易用...

收藏 9
PaddleSpeech

Stanza - 斯坦福自然语言处理 Python 库

Stanza 是斯坦福 NLP 组的官方 Python NLP(自然语言处理) 库。它支持在 60 多种语言上运行各种准确的自然语言处理工具,并支持从 Python 访问 Java Stanfo...

收藏 31
更新于 2022/04/25
Stanza

WantWords - 在线反向词典

WantWords 是一个由清华大学自然语言处理实验室出品的开源在线反向词典。与为查询词提供定义的常规(正向)词典相反,反向词典返回与查询描述语义相符的词。 功能: 解决表述问题,即无法从记忆中...

收藏 5
WantWords

xmnlp - 轻量级中文自然语言处理工具

xmnlp 是一个轻量级中文自然语言处理工具,提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首等功能。 功能概览 中文简体词法分析 (RoBERTa +...

收藏 34
更新于 2022/03/12

HarvestText - 文本挖掘和预处理工具

HarvestText 是一个专注无(弱)监督方法,能够整合领域知识(如类型,别名)对特定领域文本进行简单高效地处理和分析的库。适用于许多文本预处理和初步探索性分析任务,在小说分析,网络文本,专...

收藏 4

Chinese BERT - 中文预训练语言模型

在自然语言处理领域中,预训练语言模型(Pre-trained Language Models)已成为非常重要的基础技术。为了进一步促进中文信息处理的研究发展,我们发布了基于全词遮罩(Whole ...

收藏 5

S3 Plugin - 高性能 PyTorch 数据集库

S3-plugin 是一个高性能 PyTorch 数据集库,用于高效访问存储在 S3 存储桶中的数据集。它提供对任何大小数据集的流式数据访问,因此无需提供本地存储容量。该库旨在利用 S3 提供的...

收藏 2

Coqui TTS - 基于深度学习的文本转语音库

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经...

收藏 50
更新于 2021/09/01
Coqui TTS

Common Voice Dataset - Mozilla 开源的语音数据库

Common Voice 是 Mozilla 的开源项目,基于 MPL 协议发行,到目前为止已经诞生了几年时间,它允许志愿者们为语音识别软件的数据库做出贡献,而这个数据库属于公共领域,所有人都可...

收藏 1

NL-Augmenter - 自然语言转换的协作存储库

NL-Augmenter 旨在增加处理自然语言数据集的转换。变换以不同的方式增强文本数据集,包括:引入拼写错误、翻译成不同的语言、随机化名称和数字、转述......以及任何你所贡献的创造性增强。...

收藏 2

RosaeNLG - 自然语言生成库

RosaeNLG 是一个开源的自然语言生成(NLG)项目,旨在提供与产品 NLG 解决方案相同的 NLG 功能,并为开发人员和 IT 提供方便的集成和配置。 RosaeNLG 模板是在 VSCo...

收藏 4
更新于 2021/05/07

Txtai - 人工智能驱动的搜索引擎

Txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立了一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问-答的系统。此外,txtai 还具有用于 ...

收藏 73
更新于 2022/04/22
Txtai

Rasa - 语音和文字聊天的机器学习框架

Rasa 是一个开放源代码的机器学习框架,可自动执行基于文本和语音的对话。使用 Rasa,可以进行 NLU,对话管理,可以连接到 Slack,Facebook 等创建聊天机器人和语音助手。 使用...

收藏 17
更新于 2021/11/30

practicalAI-cn - AI 实战练习

praticeAI 是一个 AI 实战项目,让你有能力使用机器学习从数据中获取有价值的见解。 使用 PyTorch 实现基本的机器学习算法和深度神经网络 不需要任何设置,在浏览器中使用 Goog...

收藏 7

SOLSim - 基于 GloVe 和 LSTM 制作的 SOL 对话模拟器

SOLSim是基于 GloVe(求取 Embedding)和 LSTM(训练生成器)制作的SOL对话模拟器,模拟SOL在群里的对话方式。 基本处理流程 使用语料库,训练 Embedding 输入...

收藏 0
开源软件作者
JTBC 作者
MyShop 作者
xiyun-buffet-ordering 作者

DDParser - 依存句法分析系统

DDParser(Baidu Dependency Parser)是百度自然语言处理部基于深度学习平台飞桨(PaddlePaddle)和大规模标注数据研发的依存句法分析工具。其训练数据不仅覆盖了...

收藏 31
更新于 2020/08/23

yizhan2020 - SARS-CoV-2 病毒防护语料库

1.疫战 2020(yizhan2020)介绍 “疫战 2020”是一个关于新型冠状病毒疫情防护的开源语料库。 该项目由用友白清杰发起,语料库全部由来自志愿者完成编辑撰写。志愿者有来自北师大、北...

收藏 27
更新于 2020/02/14

文言 - 文言文编程语言

文言(wenyan-lang)是一门采用文言文输入的编程语言,该语言不使用英文字符,仅包含繁体中文字符,并保留繁体引号「」。 特性 采用 NLP 共享古典汉语语法 编译为 JavaScript ...

收藏 150
更新于 2019/12/19
文言

CoreNLP - 自然语言分析工具集

CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具。它可以接受原始的人类语言文本输入,并给出单词的基本形式,其词性,是否为公司,人员等的名称,规范化和解释日期,时间和数字量,标记...

收藏 25

FASPell - 简繁中文拼写检查工具

FASPell 是一个简繁体中文拼写检查工具(Chinese Spell Check/中文拼写检错/中文拼写纠错/中文拼写检查),它可以轻松完成对任何一种中文文本的拼写检查,包括简体中文文本、繁...

收藏 10
更新于 2019/11/07

没有更多内容

加载失败,请刷新页面

返回顶部
顶部
返回顶部
顶部