Yaha

"哑哈"中文分词,更快或更准确,由你来定义。通过简单定制,让分词模块更适用于你的需求。 "Yaha" You can custom your Chinese Word Segmentation efficiently by using Yaha 基本功能: 精确模式,将句子切成最合理的词。 全模式,所有的可能词都被切成词,不消除歧义。 搜索引擎模式,在精确的基础上再次驿长词进行切分,提高召回率,适合搜索引擎创建索引。 备选路径,可生成最好的多条切词路径,可在此基础上根据其它信息得...

相关文章

加载中

[博客] Yaha分词库

https://my.oschina.net/u/1180874/blog/155223

前言 因为想弄一个小小的电影搜索站,以及想提取某一个QQ技术群聊天的关键字与自动生成关键的聊天记录的摘要,所以研究了不少分词库,以及提取关键字,自动生词,自动摘要等的算法实现。整个...

2013/08/19 00:00

[问答] yaha如何安装使用?

https://www.oschina.net/question/2381518_238949

@余争 能说说怎么使用吗?是clone下来后 执行python setup.py install吗?然后进build目录执行workmaker ,可是老是报错:failed to open wordbreaker-dict.txt。完全不懂python ,能不能来个...

2015/06/06 00:00

[问答] yaha 不知道怎么使用!!

https://www.oschina.net/question/1247527_152730

@余争 你好,想跟你请教个问题: 您好 不知道你这个工具怎么使用 菜鸟一枚 要运行那个文件 要把待处理的文件放到哪里?

2014/04/26 00:00

[软件] Yaha - Python 中文分词库

https://www.oschina.net/p/yaha

"哑哈"中文分词,更快或更准确,由你来定义。通过简单定制,让分词模块更适用于你的需求。 "Yaha" You can custom your Chinese Word Segmentation efficiently by using Yaha 基本功能: 精...

[博客] Yaha分词关键字提取,自动摘要测试地址

https://my.oschina.net/u/1180874/blog/156225

Yaha分词关键字提取,自动摘要,搜索模式,相似度比较等测试地址。 测试地址:http://yahademo.appspot.com/ 测试地址2:http://yaha.sinaapp.com/...

2013/08/22 00:00

[问答] 你好,yaha的示例中的关键字提取和自动摘要是怎么实现的?

https://www.oschina.net/question/590293_154551

@余争 你好,想跟你请教个问题:yaha的示例中的关键字提取和自动摘要是怎么实现的?关键字提取只是统计了分词后的词的数量吗? 使用了一下http://yaha.sinaapp.com/,感觉效果很好,这个网站...

2014/05/11 00:00

[博客] NLP中几种分词库的简单使用(Python)

https://my.oschina.net/u/4359133/blog/3507070

几种分词方法的简单使用: 一 . jieba 安装、示例 pip install jieba,jieba分词的语料是基于人民日报。 分词示例 1 import jieba2 3 str1 ='江州市长江大桥'4 word_object = jieba.cut(str1...

2019/06/09 00:00

[博客] 快速,准确的中文文本摘要实现方法

https://my.oschina.net/u/1180874/blog/184674

以前发布过一个Yaha库 ,里面有三种不同的摘要实现方法。它们都是基于关键字提取的,缺点很明显(测试地址): 基于关键字的摘要不够准确,会提供到不少关键字份量很大同时很垃圾的句子 基于...

2013/12/16 00:00

[博客] django+haystack+whoosh+分词库=搜索站

https://my.oschina.net/u/1180874/blog/159676

前言 很少有朋友写相关haystack与whoosh的文章,更没有一个较好的示例。所以我把这个完整的示例开源了,希望有兴趣的同学能够交流。示例网站 解决的问题: 不同字段的优先级,比如Title比Con...

2013/09/06 00:00

[博客] 把代码分享作个整合:就是自动获取新闻正文,自动生成摘要简介

https://my.oschina.net/u/1180874/blog/158015

之前代码里分享了获取网页正文,关键字提取,中文摘要等。前些天有空弄了一个新闻读取的网页,把分享的代码作个整合。功能如下: 1.google把最新的新闻或博客等内容自动发送到邮箱 2.用pytho...

2013/08/30 00:00

[博客] R包和python对应的库

https://my.oschina.net/u/4285580/blog/3689563

数据库 类别 Python R MySQL mysql-connector-python(官方) RMySQL Oracle cx_Oracle ROracle Redis redis rredis MongoDB pymongo RMongo, rmongodb neo4j py2neo RNeo4j Cassandra cassand...

2019/01/03 00:00

[博客] Python 和 R 数据分析/挖掘工具互查

https://my.oschina.net/u/4345947/blog/3909042

写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到...

2018/07/11 00:00
返回顶部
顶部