jieba

软件主页
关注
jieba "结巴"中文分词:做最好的Python中文分词组件 "Jieba" Feature 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可...
加载中
1
回答
中文分词的语料库中的词是如何的生成的?

我有多篇关于汽车类的文章,文章中多次提到"本田雅阁"关键词,再语料库中没有该词语的情况下分词,会被切分成"本田" / "雅阁",怎么在不使用人工添加情况下...

05/12 22:32
1
回答
linux下使用jieba不能看到输出结果

@sunjunyi 你好,想跟你请教个问题:我在linux下运行结巴时不能输出分词结果,只输出了<generator object cut at 0x8b...

2013/04/27 19:49
4
回答
结巴有php版的吗?

@sunjunyi 你好,想跟你请教个问题:结巴有php版的吗?

2013/07/22 11:26
1
回答
结巴分词自定义字典起不到分词效果

@sunjunyi 你好,想跟你请教个问题:我现在自定义词典后,每次load后起不到作用而且运行总是这样的错误: 这是什么原因呢,另外的我字典格式类似于,...

2015/11/20 14:48
1
回答
jieba分词的Tokenize函数可以实现词性标注功能么?

@sunjunyi 你好,想跟你请教个问题:我看到结巴分词的Tokenize函数,觉得非常实用。如果再加上对词性的支持,那就更棒了。想请教一下是否已有此功...

2015/07/16 15:21
2
回答
关于并行分词的使用问题

@sunjunyi 你好,想跟你请教个并行分词的使用问题: 主页上说并行分词“将目标文本按行分隔后,把各行文本分配到多个python进程并行分词,然后归并...

2013/08/25 15:53
3
回答
jieba分词怎么用?我是小白,怎么导入需要分析的文本.提取关键词,输出?

怎么导入要分析的词语文本,(很多句子的)。- 分词-怎么提取 关键词。怎么导出? 导入文本-》分词-》提取关键词-》导出文本. 能给个脚本吗? 小白,在网...

2013/08/12 17:30
1
回答
结巴安装问题(ubuntu13+python3)

@sunjunyi 你好,想跟你请教个问题: 我是unbuntu13.04, python3, 按照网页上的命令装, 第一步:git clone http...

2013/07/31 07:29
2
回答
import jieba报错

@sunjunyi 你好,想跟你请教个问题: 我刚开始接触jieba,引入import jieba,报错: File "/usr/lib/python2....

2013/07/25 15:32
2
回答
jieba 词性标注是怎么实现的?

@sunjunyi 你好,想跟你请教个问题: 1. 最近在做分词相关的工作,看到jieba支持词性标注,不知道是怎么实现的? 2. 反观java的实现方式...

2013/07/03 18:08
3
回答
请问如何用jieba分词处理python读入的文档txt,jieba.cut()要怎么用?小白请教,多谢!!

@sunjunyi 你好,想跟你请教个问题: seg_list = jieba.cut("我来到北京清华大学",cut_all=False) print ...

2013/03/08 15:09
2
回答
怎么删除jieba自带的词库,换上自己的词库
fxsjy 的回答 2012/12/28 11:55
最佳答案
找到dict.txt这个文件,然后替换。格式是每行一个,分为三部分: 词语、概率、词性(可选)
3
回答
结巴分词怎么增加一些专业词汇
fxsjy 的回答 2012/12/18 11:42
最佳答案
请看这个issue: https://github.com/fxsjy/jieba/issues/14
3
回答
jieba 如果筛选一段文字里的tag?

@sunjunyi 你好,想跟你请教个问题: PSCWS4里面有个函数:get_tops( [int limit [, string attr]] ) 根...

2012/10/12 23:22

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部