3
回答
请问如何用jieba分词处理python读入的文档txt,jieba.cut()要怎么用?小白请教,多谢!!
终于搞明白,存储TCO原来是这样算的>>>   

@sunjunyi 你好,想跟你请教个问题:


seg_list = jieba.cut("我来到北京清华大学",cut_all=False)
print "Default Mode:", "/ ".join(seg_list) #默认模式

怎么导入文档?刚开始用python,不胜感激

举报
dreamy1107
发帖于5年前 3回/3K+阅
共有3个答案 最后回答: 5年前

不好意思,描述的不太清楚,想请问一下怎么讲分词结果输出到文档txt啊?

w= open('result.txt','w')

s="圣诞消费旺季即将到来,不得不推迟出货"
seglist = list(jieba.cut(s,cut_all=False))

for i in seglist:
    w.write(i)
f.close()

这样写,报错

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

多谢啦~

w= open('result.txt','w')

s="圣诞消费旺季即将到来,不得不推迟出货"
seglist = list(jieba.cut(s,cut_all=False))

for i in seglist:
    w.write(i.encode('utf-8')) #或者 w.write(i.encode('gbk')) 
f.close()

顶部