ChineseWordSegmentation

未知
Python
跨平台
2013-12-04
红薯

这是一个简单的中文分词程序,可以在没有语料库的情况下通过各个词语的相关度将中文词汇抽取出来 具体的理论可以参看Matrix67的博客文章: http://www.matrix67.com/blog/archives/5044 

我只是把这个算法进行了实现而已。 

该程序写得比较着急,还有很多地方可以进行速度上的优化。


的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

一种没有语料字典的分词方法

前几天在网上闲逛,看到一篇美文,说的是怎么在没有语料库的情况下从文本中提取中文词汇,理论部分讲得比较多,但都还是很浅显易懂的,其中涉及一部分信息论的理论,其实只要大学开过信息论这...

2016/04/26 01:24
379
1

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部