Duke 1.0 支持多线程,升级到 Lucene 4.0,更高的性能、更多比较器、更多清理器,命令行客户端的大幅改进等等。
Duke 是一个快速灵活的去除重复数据的引擎,基于 Lucene 开发,普通笔记本电脑可以在 11 分钟内处理完 100 万条记录。
下图是 Duke 的架构:
评论删除后,数据将无法恢复
Duke 1.0 发布,重复数据删除
Duke 1.0 支持多线程,升级到 Lucene 4.0,更高的性能、更多比较器、更多清理器,命令行客户端的大幅改进等等。
Duke 是一个快速灵活的去除重复数据的引擎,基于 Lucene 开发,普通笔记本电脑可以在 11 分钟内处理完 100 万条记录。
下图是 Duke 的架构: