mmseg4j

软件主页
关注
1、mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在...
加载中
1
回答
mmseg4j 分词问题

complex模式下“哈尔滨市” 不会分词,不应该分出‘哈尔滨’和‘哈尔滨市’吗?在max-word模式下会分成‘哈’,‘尔’,‘滨’,‘市’,这个怎么解决呢?

2016/08/02 12:24
7
回答
[转]与Lucene 4.10配合的中文分词比较(标准详细的比较)

本文转自: http://www.hansight.com/blog-lucene4.10-with-chinese-segment.html 感谢原作者...

2015/01/18 14:47
2
回答
mmseg4j的simple与complex分词效果一样

最近的项目中用到了solr4.7,因IK不支持4.7,并且之前觉得mmseg4j还不错,就选择了mmseg4j,但是遇到一个奇怪的问题。感觉simple和...

2014/06/19 10:34
3
回答
Apache Lucene拆词和搜索的问题,搜索搜不到相关的结果?求指教

整理一下问题,大概是这样: 假设一句话,被拆出了一堆词,如果不用这一些词的其中之一来搜,就搜索不到。 比如:"苹果笔记本 Macbook Pro",这个名...

2016/01/25 23:43
3
回答
mmseg4j-1.9.1与Lucene-4.10.1异常

我用的Lucene4.10.1和mmseg4j的1.9.1在部署solr的时候,core没有加载进来,我add core之后就报了这个错 ERROR se...

2014/11/15 17:04
2
回答
jcseg1.9.2搜索高亮时报错

@狮子的魂 你好,想跟你请教个问题:我用的jcseg1.9.2版本,最后lucene highlight高亮时报错: rg.apache.lucene.s...

2015/06/02 21:41
1
回答
mmseg 自定义词典

mmseg 我做了分词定义,但是最终结果没有分词,也不报错,什么问题呢

2012/06/04 17:54
4
回答
solr索引时分词,如果更新词库了怎么办??

最近在用solr做一个项目,不断开发不断完善,但同事提出一个问题,以前没考虑过,想了想好像确实有问题。 问题描述: 目前索引的时候分词器采用的是max-w...

2014/06/23 00:12
2
回答
jcseg能否实现在分出的词后自动加空格的功能?
狮子的魂 的回答 2014/08/17 12:41
最佳答案
Jcseg本身只提供分词的功能, 把一个字符串切分成一个一个的词条给你, 你想怎么处理都行. JcsegTaskConfig config = new JcsegTaskConfig(); ADictionary dic = DictionaryFactory.createDefaultDic...
1
回答
mmseg4j使用时出现一个异常

mmseg4j使用时出现这么一个异常java.lang.AssertionError: Analyzer implementation classes o...

2014/08/16 19:03
2
回答
一个新手对于全文索引的一些问题。

我目前有个项目,是自己做着玩儿的小项目,数据库有10W的数据量,跑在百度云上。 其实我是想解决搜索速度和搜索容错的问题。 通过几天的学习呢,索引,分词,搜...

2014/05/24 23:15
1
回答
请教下关于solr中文分词后,搜索结果的问题?

大家好,因为站内搜索的需求,搞了个solr来进行站内搜索,由于以前也没接触过,这里小弟碰到一个问题,希望路过的大侠能帮着解决一下,或是给指点一下是因为什么...

2013/12/21 12:12
1
回答
php有没有类似java中MMAnalyzer分词器呀?

如题,谁对php分词比较熟悉呀,php中有没有像java中的MMAnalyzer分词器呀,不管正向最大匹配还是逆向最大匹配,知道的介绍款,谢谢啦!

2011/12/27 17:02
1
回答
中文分词 mmseg4j 在 lucene 中的使用示例

mmseg4j 发布也有一段时间了,前些日子忙着发布新的版本,修正 bug 之类的。使用示例一直拖到现在,其实 svn 上的 test 有使用 lucen...

2010/02/27 11:16
3
回答
mmseg4j 和IK Analyzer 那个分词器更好用
lavafree 的回答 2013/02/27 15:56
最佳答案
mmseg4j和IK Analyzer速度和分词准确率基本都差不多,mmseg4j可以动态添加词库,所以我的应用中选择了mmseg4j
2
回答
Xmm4048m luence mmseg4j 加载440万关键词,用了731348ms

对内存设置3g都不行,加载到330万的时候加载速度越来越慢,所有堆最大内存设成4g,结果用了731348ms。fuck,mmseg4j词库关键词加载太吃内...

2012/03/19 19:33
2
回答
OSChina开源社区的中文分词方案是怎么实现的?

想请教一个问题:OSChina开源社区的中文分词方案红薯是怎么实现的?之前用IKAnalyzer, 庖丁, mmseg4j做过测试和比较, 都或多或少有一...

2012/02/15 21:57
3
回答
有谁用过 mmseg4j 这个中文分词器?

看介绍挺牛逼的,不知道跟 IKAnaylzer 和 Paoding 相比较怎样,有没有人试过?

2009/09/26 23:31

没有更多内容

加载失败,请刷新页面

返回顶部
顶部