关于word1.3,用自定义用户词典分词

五月七日阳天 发布于 2017/03/21 12:12
阅读 147
收藏 0

@杨尚川 你好,想跟你请教个问题:

我想用word1.3作为一个中文关键字提取程序的分词器,我对分词后的词频数据进行加工,将一些词组合为专业领域词,并将这些词加入了我的领域词库。之后在为word指定我的自定义词库后再做一次分词,可是分词结果还是和之前一样,我组合起来的词又被切开了,这是为什么?我指定词典后确认reload过了。
WordConfTools.set("dic.path", "classpath:myDic/newDic.txt");
DictionaryFactory.reload();
List<Word> tlWords = WordSegmenter.seg(tlInput,SegmentationAlgorithm.MaximumMatching);
与选择的分词算法有关吗?还是说优先使用默认的词典?

加载中
返回顶部
顶部