自然语言处理 HanLP

Apache
Java 查看源码»
跨平台
2015-03-28
hankcs

【年终提升】2019尾声,来 OSC·年终盛典收割技术干货,get新技能!>>>

HanLP: Han Language Processing

汉语言处理包

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

HanLP 提供下列功能:

  • 中文分词 

    • 最短路分词

    • N-最短路分词

    • CRF分词

    • 索引分词

    • 极速词典分词

    • 用户自定义词典

  •   词性标注

  • 命名实体识别 

    • 中国人名识别

    • 音译人名识别

    • 日本人名识别

    • 地名识别

    • 实体机构名识别

  • 关键词提取 

    • TextRank关键词提取

  • 自动摘要 

    • TextRank自动摘要

  • 短语提取 

    • 基于互信息和左右信息熵的短语提取

  • 拼音转换 

    • 多音字

    • 声母

    • 韵母

    •  声调

  • 简繁转换 

    • 繁体中文分词

    • 简繁分歧词

  • 文本推荐 

    • 语义推荐

    • 拼音推荐

    • 字词推荐

  • 依存句法分析 

    • MaxEnt依存句法分析

    • CRF依存句法分析

  • 语料库工具 

    • 分词语料预处理

    • 词频词性词典制作

    • BiGram统计

    • 词共现统计

    • CoNLL语料预处理

    • CoNLL UA/LA/DA评测工具

在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料。

的码云指数为
超过 的项目
加载中

评论(3)

秦客丶云舒
秦客丶云舒
拼音的转换,字母中文混合转换很是蛋疼
CloudyKuan
CloudyKuan
sun.reflect.ReflectionFactory 这个类是非开放的,请教你是怎么编译通过的?
我的上铺叫路遥
我的上铺叫路遥
开源的中文语料很棒!

HanLP 2.0.0-alpha.0 发布,2.0 带来一系列新特性

HanLP 2.0.0-alpha.0 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特...

01/03 07:29

HanLP 1.7.6 发布,代号“最后的武士”

HanLP 1.7.6 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在...

01/02 07:07

HanLP 1.7.4 发布,与 OpenCC 完全一致的简繁转换

HanLP 1.7.4 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在...

2019/07/01 07:11

汉语言处理包 HanLP 1.7.3 发布,常规维护版本

HanLP 1.7.3 发布了。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在...

2019/04/21 07:17

汉语言处理包 HanLP 1.7.1 发布,缓存生成提速37倍

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

2018/12/24 07:55

HanLP 1.7.0 发布,新增文本聚类、流水线分词

HanLP 1.7.0 发布了,HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在...

2018/11/13 07:23

汉语言处理包 HanLP 1.6.7 发布,改进人名 UV 拆分

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

2018/08/15 07:47

汉语言处理包 HanLP 1.6.4 发布,优化新词发现

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

2018/05/22 08:01

汉语言处理包 HanLP 1.6.3 发布,支持动态用户词典

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

2018/04/16 16:36

汉语言处理包 HanLP 1.6.2 发布,支持简繁和索引模式

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,...

2018/04/03 10:13

没有更多内容

加载失败,请刷新页面

1
回答
hanlp 如何快速从分词仅取出人名?
開源中國張學友 的回答 2017/11/10 09:19
最佳答案
简单一点用 : endsWith 复杂一点用:正则表达式匹配
4
回答
solr搜索不到中文分词的结果

使用的hanlp分词,索引和搜索的时候都将enableIndexMode参数设为true了,分词结果如下: 全词匹配搜“中医”是可以搜出来的 全词匹配搜“...

2017/04/21 16:00
1
回答
关于hanlp分词系统的问题

hanlp中用NLPTokenizer进行分词处理,出现“英国退欧对英国”分成一个词的现象,还出现 “石化]”这种类似的现象,不知道是因为什么原因。使用的...

2016/06/30 11:49

没有更多内容

加载失败,请刷新页面

没有更多内容

自然语言处理工具python调用hanlp中文实体识别

Hanlp作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于hanlp这款分词工具还是很认可的。本篇继续分享一篇关于hanlp的使用实例即Python调用hanlp进行中文...

2019/02/13 09:11
65
0
Spring Boot中对自然语言处理工具包hanlp的调用详解

概 述 HanLP 是基于 Java开发的 NLP工具包,由一系列模型与算法组成,目标是普及自然语言处理在生产环境中的应用。而且 HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点,...

2018/11/22 12:38
840
0
ubuntu下使用pycharm调用Hanlp自然语言处理包

首先点击File,选择Settings,在Project 下点击Project Interpreter,并通过点击右边的加号: 搜索JPype,根据python版本选择你需要的JPype版本安装。 之后,在https://github.com/hankcs/HanLP...

2018/11/05 15:20
21
0
在CSharp中调用HanLP

今天有用户想在CSharp里调用HanLP的API,遇到了些小问题。所以我干脆自己写了个指南,一步步演示IKVM与HanLP的集成方法,供广大C#程序员参考。本方法也可推广到用C#调用任何Java jar类库,并...

2018/11/08 17:17
12
0
hanlp for elasticsearch(基于hanlp的es分词插件)

摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组...

2018/11/05 15:05
33
0
HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件,核心功能: 兼容 ES 5.x-7.x; 内置词典,无需额外配置即可使用; 支持用户自定义词典; 支持远程词典热更新(待开发); 内置多种分词模式,适合...

2019/04/22 13:09
11
0
自然语言处理之:搭建基于HanLP的开发环境(转)

环境搭建比FNLP的简单,具体参考:https://github.com/hankcs/HanLP 各个版本的下载:https://github.com/hankcs/HanLP/releases 完毕后有一个报错: 字符类型对应表加载失败: D:/eclipse_wo...

2018/11/09 09:36
402
0
ubuntu下pycharm调用Hanlp实践分享

前几天看了大快的举办的大数据论坛峰会的现场直播,惊喜的是hanlp2.0版本发布。Hanlp2.0版本将会支持任意多的语种,感觉还是挺好的!不过更多关于hanlp2.0的信息,可能还需要过一段时间才能看...

2018/12/14 09:09
354
0
基于hanlp的es分词插件

摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组...

2019/07/01 10:50
19
0
自然语言处理工具包HanLP的Python接口

pyhanlp: Python interfaces for HanLP HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。 安装 pip install pyhanlp 使用命令hanlp来验证安装,如因网络等原因自动安装HanLP失败...

2018/10/09 17:32
74
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部