和文本分析有关的问题 我是纯小白 中科院ICTCLAS

白露姑娘 发布于 2016/08/24 15:33
阅读 85
收藏 0

大家好,我是今年毕业的应届生小白,公司让做一个功能:搜索热词分析。简单说就是有一个类似于天猫那样的电商平台,用户会在上面输入一系列的搜索词,比如:夏季裙子、短裙。我现在要找出用户的搜索热词。查了一周的资料,初步确定了方案,分为:分词、去停用词、合并意思相近的搜索词等(具体的不阐述了)

我现在有个小白的问题求教大家,谢谢!

(1)中科院的ICTCLAS系统里面自带分词库吗?从哪里能下到,还有别的词库推荐吗

(2)中科院的ICTCLAS系统里面自带停用词库吗?从哪里能下到,还有别的停用词库推荐吗

(3)中科院的ICTCLAS系统里面自带同义词库吗?从哪里能下到,还有别的同义词库推荐吗

(4)中科院的ICTCLAS系统所涉及的分词算法,从哪里能下到他的算法理论知识

感激不尽...

加载中
0
IdleMan
IdleMan
可以带词性;同义词应该没有;论文库搜索;
白露姑娘
从哪里能下到这个词库,谢谢
0
IdleMan
IdleMan
他的词库应该是二进制的;结巴分词是文本格式
返回顶部
顶部