快速文本分类器 FastText

BSD
C/C++ 查看源码»
跨平台
Facebook
2016-08-05
开源中国股瞎
温馨提示:该项目除了使用 BSD 协议授权外,还需遵守附加的专利授权

FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。

FastText是一个旨在协助创建文本表达和分类的可伸缩解决方案的资料库。它最主要的一个优势是适用于非常大的数据库、某种深度神经网络——其中一种经常被拿来解决文本分类问题的解决方案,这意味着它能用于协助文本处理。

FastText能够在几秒钟或几分钟内完成某一个大型数据库的培训。类似于它这样的系统已经在网络的垃圾邮件过滤中得到运用,相信伴随着fastText的开源,像Siri、Google Now等这样的语音助手将能更有效地对自然语言展开解析。

使用环境:

  • (gcc-4.6.3 or newer) or (clang-3.3 or newer)

  • python 2.6 or newer

  • numpy & scipy

安装:

$ git clone git@github.com:facebookresearch/fastText.git
$ cd fastText
$ make
的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

Facebook 开源的快速文本分类器 FastTex

FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。 1. fastText 原理 fastText 方法包含三部分:模型架构、层次 So...

2016/08/19 08:42

没有更多内容

加载失败,请刷新页面

没有更多内容

暂无问答

【NLP】【七】fasttext源码解析

【一】关于fasttext fasttext是Facebook开源的一个工具包,用于词向量训练和文本分类。该工具包使用C++11编写,全部使用C++11 STL(这里主要是thread库),不依赖任何第三方库。具体使用方法...

2018/11/17 15:32
222
0
达观数据王江:fastText原理及实践

fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在学术上并没有太大创新。但是它的优点也非常明显,在文本分类任务中,fastText(浅层网络)往往能取得和深度网络相媲美的精...

2018/12/03 11:41
6
0
安装fasttext报错:command 'x86_64-linux-gnu-gcc

听说win安装fasttext麻烦,linux上安装方便,结果我win10直接pip install 安装上去了,ubantu上pip install fasttext反而报错:error: command 'x86_64-linux-gnu-gcc' failed with exit st...

2018/07/11 00:00
154
0
Flair实战文本分类

Flair是一个基于PyTorch构建的NLP开发包,它在解决命名实体识别(NER)、语句标注(POS)、文本分类等NLP问题时达到了当前的顶尖水准。本文将介绍如何使用Flair构建定制的文本分类器。 简介 ...

2018/12/25 22:25
37
0
用最新NLP库Flair做文本分类

摘要: Flair是一个基于PyTorch构建的NLP开发包,它在解决命名实体识别(NER)、部分语音标注(PoS)、语义消歧和文本分类等NLP问题达到了当前的最高水准。它是一个建立在PyTorch之上的NLP框...

01/09 11:28
8
0
基于腾讯AI Lab词向量进行未知词、短语向量补齐与域内相似词搜索

AI Lab开源大规模高质量中文词向量数据,800万中文词随你用,质量非常高,就是一个词向量.txt文件都有16G之多,太夸张了。。不过的确非常有特点: ⒈ 覆盖率(Coverage): 该词向量数据包含...

2018/12/19 11:24
92
0
史上最全TensorFlow学习资源汇总

史上最全TensorFlow学习资源汇总

2018/04/12 23:24
322
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部