FoolNLTK 发布 Java 版,基于深度学习的中文文本处理工具

正_午
 正_午
发布于 2018年03月13日
收藏 37

FoolNLTK 是一款基于深度学习的中文文本处理工具,暂时包含分词,词性标注,实体识别。现发布 Java 版。

<dependency>
  <groupId>me.midday</groupId>
  <artifactId>JFoolNLTK</artifactId>
  <version>1.0</version>
</dependency>

Example

// 单文本 String text = "北京欢迎你"; 
LexicalAnalyzer lexicalAnalyzer = FoolNLTK.getLSTMLexicalAnalyzer(); // 分词 
List<List<Word>> words = lexicalAnalyzer.cut(text); 
for(List<Word> ws: words){
    ws.forEach(System.out::println); } // 词性标注 
List<List<Word>> posWords = lexicalAnalyzer.pos(text); 
for(List<Word> ws: posWords){
    ws.forEach(System.out::println); } // 实体识别 
List<List<Entity>>  entities = lexicalAnalyzer.ner(text);  
for(List<Entity> ents :entities){
    ents.forEach(System.out::println); } // 分词,词性,实体识别 
List<AnalysisResult>  results = lexicalAnalyzer.analysis(text); results.forEach(System.out::println);   // 多文本  
System.out.println(); 
System.out.println("多文本:"); 
List<String> docs = new ArrayList<>(); 
docs.add(text); docs.add(text); // 分词 
List<List<Word>> dWords = lexicalAnalyzer.cut(docs); 
for(List<Word> ws: dWords){
    ws.forEach(System.out::println); } // 
词性标注 List<List<Word>> dPosWords = lexicalAnalyzer.pos(docs); 
for(List<Word> ws: dPosWords){
    ws.forEach(System.out::println); }
List<List<Entity>>  dEntities = lexicalAnalyzer.ner(docs);  
for(List<Entity> ents :dEntities){
    ents.forEach(System.out::println); } // 分词, 词性标注,实体识别 
List<AnalysisResult>  dResults = lexicalAnalyzer.analysis(docs); dResults.forEach(System.out::println);

GitHub  
码云

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:FoolNLTK 发布 Java 版,基于深度学习的中文文本处理工具
加载中

最新评论(11

null_zhou
null_zhou
英文的效果如何
花花兽
花花兽
使用场景是?
正_午
正_午

引用来自“沙枣”的评论

中文文本处理工具主要是用于语言翻译吗?
分词,实体识别,词性标注
沙枣
沙枣
中文文本处理工具主要是用于语言翻译吗?
_
_hejg
马克
正_午
正_午

引用来自“正_午”的评论

发出来,不能预览吗?,这代码贴成这样,还没法改:sweat:

引用来自“局长”的评论

重新编辑了下(快去给红薯差评~!
好多了,感谢!!!!
局长
局长

引用来自“正_午”的评论

发出来,不能预览吗?,这代码贴成这样,还没法改:sweat:
重新编辑了下(快去给红薯差评~!
正_午
正_午

引用来自“正_午”的评论

发出来,不能预览吗?,这代码贴成这样,还没法改:sweat:

引用来自“wendal”的评论

osc新闻编辑页面的体验极差的
领教了
wendal
wendal

引用来自“正_午”的评论

发出来,不能预览吗?,这代码贴成这样,还没法改:sweat:
osc新闻编辑页面的体验极差的
正_午
正_午
发出来,不能预览吗?,这代码贴成这样,还没法改:sweat:
返回顶部
顶部