SCWS 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
SCWS 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
SCWS 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
SCWS 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
SCWS 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !
授权协议 未知
开发语言 PHP
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发中文分词库
开源组织
地区 国产
投 递 者 红薯
适用人群 未知
收录时间 2010-05-23

软件简介

SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统

这是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开, 所以如何准确而又快速的分词一直是中文分词的攻关难点。

SCWS 在概念上并无创新成分,采用的是自行采集的词频词典,并辅以一定程度上的专有名称、人名、地名、数字年代等规则集,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些中小型搜索引擎、关键字提取等场合运用。 SCWS 采用纯 C 代码开发,以 Unix-Like OS 为主要平台环境,提供共享函数库,方便植入各种现有软件系统。此外它支持 GBK,UTF-8,BIG5 等汉字编码,切词效率高。

展开阅读全文

评论 (2)

加载中
SCWS 中文分词在win7 64位系统上怎么加载不了呀。。phpinfo()里面输出不了。
2013/07/19 15:05
回复
举报
简易中文分词 SCWS 提供有PECL扩展以及中文词典,PHP使用起来很方便,可以搭配MySQL的FullText索引(MyISAM/InnoDB)实现简单的全文搜索引擎. http://www.xunsearch.com/scws/docs.php#instscws
2015/03/23 21:06
回复
举报
更多评论
暂无内容
发表了博客
2019/04/24 18:14

scws安装

mkdir scws cd scws wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 tar xvjf scws-1.2.3.tar.bz2 cd scws-1.2.3 ./configure --prefix=/usr/local/scws make && make install # 下载字典 cd /usr/local/scws/etc wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 tar xvjf scws-dict-chs-gbk.tar.bz2 tar xvj...

0
0
发表了博客
2019/01/10 17:29

scws中文分词PHP

Linux下安装scws和安装PHP的scws扩展 wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 tar xvjf scws-1.2.3.tar.bz2 cd scws-1.2.3/ ./configure --prefix=/usr/local/scws make && make install cd ../scws/ ls -al lib/libscws.la /usr/local/scws/bin/scws -h cd /usr/local/src/scws-1.2.3/phpext /usr/bin/phpize ./configure --with-php-config=/usr/bin/php-config make && make install vim /etc/php.ini ...

0
0
2019/04/11 16:59

SCWS-1.2.3 安装说明

以 Linux(centos7) 操作系统为例 1. 取得 scws-1.2.3 的代码 wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 2. 解开压缩包 [hightman@d1 ~]$ tar xvjf scws-1.2.3.tar.bz2 3. 进入目录执行配置脚本和编译 [hightman@d1 ~]$ cd scws-1.2.3[hightman@d1 ~/scws-1.2.3]$ ./configure --prefix=/usr/local/scws ; make ; make install 注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure --help...

0
0
发表了博客
2019/03/12 12:12

php分词工具scws

分词工具 sphinx 支持php版本5.2.2~6.0因此选用scws 文档地址 http://www.xunsearch.com/scws/docs.php#instscws 简单的demo(测试有效) $so = scws_new(); //设置分词时所用编码 $so->set_charset('utf-8'); //设置分词所用词典(此处使用utf8的词典) $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); //设置分词所用规则 $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //分词前去掉标点符号 $so->set_ignore(tr...

0
0
发表了博客
2018/04/07 17:29

scws中文分词安装和使用

一、下载源码 wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2 tar xvjf scws-1.2.3.tar.bz2 二、执行配置脚本和编译 具体选项参数执行 ./configure --help 查看。常用选项为:--prefix=指定安装目录 cd scws-1.2.3 ./configure --prefix=/usr/local/scws make && make install 检查是否安装成功 ls -al /usr/local/scws/lib/libscws.la /usr/local/scws/bin/scws -h 三、下载通用词典 cd /usr/local/scws/etc...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2014/04/04 08:08

scws 分词试用 疑惑

昨天试用了一下scws,按照官方网站的说明 http://www.xunsearch.com/scws/docs.php 下载安装了scws 同时安装了php的扩展 http://www.xunsearch.com/scws/docs.php#phpscws 试用了一下说明文档中给出的demo <?php $sh = scws_open(); scws_set_charset($sh, 'gbk'); scws_set_dict($sh, '/path/to/dict.xdb'); scws_set_rule($sh, '/path/to/rules.ini'); $text = "我是一个中国人,我会C++语言,我也有很多T恤衣服"; scws_send_...

1
0
发表了问答
2011/09/23 13:52

xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

经过 2 周如火如荼的测试和修正,很高兴如期发布 xunsearch-1.0.0 正式稳定版,这也是 xunsearch 的第一个正式版本。 Xunsearch 是免费开源的专业全文检索解决方案,旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40...

3
6
发表了问答
2011/09/09 17:32

发布 xunsearch-1.0.0b 测试版(全文检索,基于xapian和scws)

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低 服务器搜索负荷、极大程度的提高搜索速度和 用户体验。 支持海量数据高速检索,功能强大,简单易用,而且开源免费!代码已经全部托管在 github 上。 经过数月的努力开发,目前终于发布测试版本,该版本主要用于测试...

3
2
发表了问答
2011/05/25 18:20

中文分词的同学们一起研究

因最近公司需要重相应的中文分词的处理,不知道哪位哥哥,姐姐,弟弟,妹妹,有好的方法呢?? 虽然我对scws已经觉得做的很不错,但我还是想着有没有更好的能够让我们的技术得到提升。。。 谢谢!

7
5
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
2 评论
74 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部