授权协议: 未知
开发语言: Python
操作系统: 跨平台
收录时间: 2012-11-01
提 交 者: zoowii

重复检测软件(Python实现)

可以检测英文文档之间的重复,包括完全重复(除标点,格式外都相同),和相近重复(部分(90%)抄袭)

TODO: 1. 数据抄袭(英文文档中数据集中的地方,比较多的数据相同) 2. 中文分词 3. 噪音消除

 

展开阅读全文

代码

DuplicateDetector 的相关资讯

还没有任何资讯

DuplicateDetector 的相关博客

还没有任何博客,写博客

评论 (0)

加载中
更多评论
0 评论
7 收藏
分享
在线直播报名
返回顶部
顶部