scws 分词试用 疑惑

bozz 发布于 2014/04/04 08:08
阅读 428
收藏 0

昨天试用了一下scws,按照官方网站的说明

http://www.xunsearch.com/scws/docs.php

下载安装了scws

同时安装了php的扩展

http://www.xunsearch.com/scws/docs.php#phpscws

试用了一下说明文档中给出的demo

<?php
$sh = scws_open();
scws_set_charset($sh, 'gbk');
scws_set_dict($sh, '/path/to/dict.xdb');
scws_set_rule($sh, '/path/to/rules.ini');
$text = "我是一个中国人,我会C++语言,我也有很多T恤衣服";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 5);
print_r($top);
?>



然后我得到的结果是

Array
(
    [0] => Array
        (
            [word] => C++
            [times] => 1
            [weight] => 9.5
            [attr] => nz
        )

    [1] => Array
        (
            [word] => 一个
            [times] => 1
            [weight] => 1
            [attr] => mt
        )

)



看着这样的结果,我只能说,呵呵

面对评价很高的scws,显然这不是我想要的结果,一定是我什么地方搞错,坐等有使用经验同学点拨



加载中
0
whatcq
whatcq

我也遇到这个问题,看来要仔细点。scws_get_tops  

$so = scws_new();
$so->set_charset('gbk');
// 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件
$so->send_text("我是一个中国人,我会C++语言,我也有很多T恤衣服");
while ($tmp = $so->get_result())
{
  print_r($tmp);
}
$so->close();
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部