当前访客身份:游客 [ 登录 | 加入开源中国 ]

开源项目

当前位置:
开源软件 » 分类导航 » 程序开发 » 自然语言处理

软件分类

共有29 自然语言处理开源软件,第1

软件过滤: 排序: 收录时间 | 浏览数
  • 全球最精准自然语言解析器 SyntaxNet

    SyntaxNet 是一个框架,即学术圈所指的SyntacticParser,他是许多NLU系统中的关键组件。在这个系统中输入一个句子,他会自动给句子中的每一个单词 打上POS(part-of-Speech)标签,用来描述这些词的句法功能,并在依存句法树中呈现。这些句法关系直接涉及句... SyntaxNet 更多SyntaxNet信息

    最近更新: SyntaxNet —— Google 开源自然语言解析器 发布于 7个月前

  • 中文自然语言处理工具包 FudanNLP

    FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。 演示地址: http://jkx.fudan.edu.cn/nlp/query FudanNLP目前实现的内容如下: 中文处理工具 中文分词 词性标注 实体名识别 句法分析 时间表达式识别 信息检... 更多FudanNLP信息

  • Java自然语言处理 LingPipe

    LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Que... 更多LingPipe信息

  • 自然语言处理工具 OpenNLP

    OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。 OpenNLP 更多OpenNLP信息

    最近更新: Apache OpenNLP 1.6.0 发布 发布于 1年前

  • 自然语言工具包 NLTK

    NLTK 会被自然地看作是具有栈结构的一系列层,这些层构建于彼此基础之上。那些熟悉人工语言(比如 Python)的文法和解析的读者来说,理解自然语言模型中类似的 —— 但更深奥的 —— 层不会有太大困难。 尽管 NLTK 附带了很多已经预处理(通常是手工地)到... 更多NLTK信息

    最近更新: 探索 Python、机器学习和 NLTK 库 发布于 4年前

  • 自然语言处理工具 CRF++

    CRF++是著名的条件随机场开源工具,也是目前综合性能最佳的CRF工具。CRF++本身已经是个比较老的工具了,但鉴于其性能较好,仍然是自然语言处理很重要的一个工具。 NlpBamboo 中文分词库在使用该工具。 更多CRF++信息

  • 自然语言处理 HanLP

    HanLP: Han Language Processing 汉语言处理包 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能: 中文分词  最短路分词 ... HanLP 更多HanLP信息

  • 单词转换成向量形式 word2vec

    word2vec(word to vector)是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。word2vec为计算向量词提供了一种有效的连续词袋(bag-of-words)和skip-gram架构... 更多word2vec信息

  • 机器学习软件包 Mallet

    Mallet是专门用于机器学习方面的软件包,此软件包基于java。通过mallet工具,可以进行自然语言处理,文本分类,主题建模。文本聚类,信息抽取等。 更多Mallet信息

  • 文本自动摘要工具 TextTeaser

    TextTeaser是一个自动摘要算法,结合了自然语言处理的力量和机器学习产生好结果。 更多TextTeaser信息

    最近更新: 文本自动摘要工具 TextTeaser 开源 发布于 2年前

  • 分布式在线机器学习框架 Jubatus

    Jubatus 是一个分布式处理框架和机器学习库,包含以下功能: 在线机器学习库,包括:分类、聚合和推荐 fv_converter: 数据预处理(用自然语言) 在线机器学习框架,支持容错 更多Jubatus信息

  • 大规模知识加速器 LarKC

    欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模知识加速器(LarKC,其发音为“lark”),LarKC被设计为一个大规模分布式不完备推理平台,该平台用于突破语义万维网(Semantic Web)推理系统目前面临的知识处理规模瓶颈。... 更多LarKC信息

  • 自然语言处理 UBY

    UBY是一个大规模的统一的文章资源,为自然语言处理(NLP)基于ISO标准词汇标记框架(LMF)。 更多UBY信息

  • simhash算法库 simhash

    专门针对中文文档的simhash算法库 简介 此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。 详见SimhashBlog 特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函... 更多simhash信息

  • 分布式机器学习框架 Petuum

    Petuum 是一个分布式机器学习框架。它致力于提供一个超大型机器学习的通用算法和系统接口。它主要集中在系统上 "plumbing work"和算法加速的优化上面,当简化分布式 ML 程序实现时——允许你聚焦在模型优化和大数据分析方面。Petuum 能够在集群和云计算(比... 更多Petuum信息

  • 自然语言文本处理库 spaCy

    spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。 示例代码: >>> import spacy.en >>> from spacy.parts_of_speech import ADV >>> # Load the pipeline, and call it with some text. >>> nlp = spacy.en.English() ... 更多spaCy信息

    最近更新: spaCy V1.1.0 发布,NLP 自然语言文本处理库 发布于 1个月前

  • DKPro Core

    DKPro Core 是基于 Apache UIMA 框架之上的自然语言处理(NLP)的软件组件。DKPro Core 提供了这样的第三方工具以及原NLP组件的包装。 DKPro核心建立在很大程度上uimaFIT可以快速方便的开发NLP处理管道。 DKPro Core is a collection of software compone... 更多DKPro Core信息

  • 多语开发工具包 multilanguage

    multilanguage 是一个多语开发工具包,用于缓存多语系统的多语值,它拥有良好的性能,并且能防止内存泄露。 当开发了一套产品,即想要卖给大陆客户,也想要卖给港台用户,这时就需要支持简体和繁体; 当一个国内站点需要拓展到美国时,这时就需要支持简体和... 更多multilanguage信息

  • DKPro WSD

    DKPro WSD 提供 UIMA 组件,封装了语料库注释器,词汇语义资源,WSD 算法,评估和报告工具。用户可以配置组件,或者重写和安排它们到数据处理管道。DKPro WSD 是模块化的工具,非常灵活。提供相同功能的组件可以相互替换,你可以很容易地在不同的数据集上运... DKPro WSD 更多DKPro WSD信息

  • 回文构词法 Salad

    Salad 是一种有效且灵活的实现著名的异常检测方法回文构词法王et al . 2006(RAID)。Salad 是基于语法模型,数据表示为其所有的子字符串的长度n。在训练这些gram)存储在一个布隆过滤器。这使得探测器来表示大量 gram)在小内存,仍然能够有效地访问数据。Salad... 更多Salad信息

    最近更新: Salad 0.4.2 发布,回文构词法 发布于 3年前