4
回答
支持 Lucene 5.5 的中文分词有哪些?
注册华为云得mate10,2.9折抢先购!>>>   

我看 mmseg4j 和 IKAnalyzer 都没有更新了

Lucene 自带的 smartcn,它会把不认识的词都分成一个一个的字

比如:“昭觉寺” 和 “长谷寺”
会分解成:“昭”“觉”“寺” , “长”“谷”“寺”

所以导致我搜索“昭觉寺”

“长谷寺” 也会出现在搜索结果里面

请问有什么办法改进一下吗?

举报
AkataMoKa
发帖于2年前 4回/413阅
顶部