请问提取关键字的原理是什么?

丫丫草 发布于 2013/07/23 15:23
阅读 976
收藏 4

请问提取关键字的原理是什么?根据词性?文档tf/idf做什么用呢?

我如何定义自己的关键字词库,比如我需要提取的内容是IT类的信息,我自己有一个IT类的词库,如何加载来提取关键字呢?

加载中
0
a
ansj

用treesplit+idf吧..不要用分词...大材小用了...

y
yeyefengisme
你意思是关键字提取和分词是分开实现的吗?二者不依赖?
丫丫草
丫丫草
如果我的内容非常短(比如微博),idf找不到相关词语,如何抓内容的关键字(内容中不出现)呢?
0
a
ansj

看我github里面有个开源的tire树抽词...就是tree-split

0
Y
Yanshare
好像有相关的来源项目,在osc中找分词处理看看
返回顶部
顶部