分词技术,动态扩展词典

zheng_pat 发布于 2013/01/06 15:36
阅读 461
收藏 0
1.对于使用IK和lucene集合做中文搜索。假设对于一个论坛系统,大量用户发帖,帖子内容中出现IK不能分词的词句,假设啊比如AB,IK的处理结果是A和B,而不是AB。但是用户搜索就是用AB做搜索,结果发现,查询无结果。这种情况该怎么处理。我们难道把类似的单子,只要发现搜索无结果就加入用户词典?再更新下索引吗
加载中
1
林良益
林良益

1.如果IK在索引的时候切分成A|B,那么理论上用户搜素AB的时候,关键词也会被切分成A|B才对。

2.关于搜索的优化,请参看《源创汇》厦门站活动,IK分词与搜索主题中的SWMC搜索算法来解决上述问题。

林良益
林良益
回复 @icymoon : http://www.oschina.net/events 源创汇系列
i
icymoon
请教一下,你说的《源创汇》厦门站活动,是什么,没有找到
返回顶部
顶部