如何进行n元分词结果输出

Alex.Wong 发布于 2014/09/20 10:32
阅读 215
收藏 0

@狮子的魂 你好,想跟你请教个问题:

比如想进行二元分词,或者三元分词输出,该怎么整?

jcseg.stokenminlen我重置了这个zhi貌似没效果。是不是我那一步搞错了?

参考网址:http://www.xunsearch.com/scws/demo/v48.php

加载中
0
狮子的魂
狮子的魂

二元分词不需要词库,也不需要这么复杂的算法。 直接写个程序就ok了,Jcseg目前没有集成这个功能。

jcseg.stokenminlen 这个选项是用来调节英文二次切分的子token的最小长度。 

Alex.Wong
Alex.Wong
就比如 紅酒柜 ,分出來的詞語的結果我的預想是紅酒 紅酒柜,但實際上算法出來的結果是紅 酒柜。怎麼解決這種類似的問題?
0
狮子的魂
狮子的魂

@Alex.Wong 

在词库中增加词条红酒柜,就会切分得到"红酒柜"了。 至于要切分成:红酒 红酒柜, 这种专用于检索的使用,需要等后期Jcseg发布的复杂中文的二次切分。

Alex.Wong
Alex.Wong
好的
返回顶部
顶部