jieba 如果筛选一段文字里的tag?

csilc 发布于 2012/10/12 23:22
阅读 529
收藏 1

@sunjunyi 你好,想跟你请教个问题:

PSCWS4里面有个函数:get_tops( [int limit [, string attr]] )   根据 send_text 设定的文本内容,返回系统计算出来的最关键词汇列表。 

这个函数我用来“筛选”一段文字里面的tag。

请问jieba有类似的函数么?

谢谢!

加载中
1
fxsjy
fxsjy
目前还没有提供这个功能,这个需要计算词语的TF/IDF值,然后排序号求最高的几个。
csilc
csilc
谢谢。我现在是先分词 然后把一些“冗余词”,比如“的”“了”去掉。呵呵。。。不知道这个可以否?
0
fxsjy
fxsjy

我刚刚加上了tag提取的功能,还没有正式发布,你可以用github里面的最新啊代码。

用法示例: https://github.com/fxsjy/jieba/blob/master/test/extract_tags.py



metalhammer
metalhammer
@ sunjunyi 你好,关于github里面的示例代码劳烦您能不能简单讲解一下它的含义 我发了一个求助帖就是关于这个问题的http://www.oschina.net/question/1437095_140621
csilc
csilc
太好了。多谢。
0
返回顶部
顶部