HTTPCWS 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
HTTPCWS 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议: BSD
开发语言: C/C++
操作系统: Linux
收录时间: 2009-08-11
提 交 者: 张宴

HTTPCWS是一款Linux下的基于HTTP协议的开源中文分词系统,采用BSD协议。

这个分词系统是对中国科学院计算技术研究所免费提供的 ICTCLAS 3.0 共享版分词后的结果,再采用逆向最大匹配算法,根据作者自己补充的一个9万条词语的自定义词库,对ICTCLAS分词结果进行合并处理,输出最终分词结果。目前只支持GBK编码。

经过测试,局域网内 HTTPCWS 接口中文分词平均处理速度(Wait时间):0.001秒,每秒可处理5000~20000次请求。(演示地址

展开阅读全文

HTTPCWS 的相关资讯

还没有任何资讯

HTTPCWS 的相关博客

网上blog

http://www.cnblogs.com/it-cen/ http://zyan.cc/httpcws_v100/ httpcws 中文分词 http://www.cnblogs.com/txw1958 方倍工作室...

什么是词性标注(POS tagging)

词性标注也叫词类标注,POS tagging是part-of-speech tagging的缩写。 维基百科对POS Tagging的定义: In corpus linguistic...

使用Libevent编写高并发Http Server

libevent库使得高并发响应HTTP Server的编写变得很容易。整个过程包括如下几部:初始化,创建HTTP Server, 指定callback, 进入...

NLP+词法系列(一)︱中文分词技术小结、几大分词引擎的介绍与比较

<div class="htmledit_views" id="content_views"> <p>笔者想说:觉得英文与中文分词有很大的区别,毕竟中文的表达方式跟英语...

HTTPCWS 的相关问答

3
回答

评论 (0)

加载中
更多评论
0 评论
30 收藏
分享
返回顶部
顶部