PDF 转换文本工具 pdf_searcher

GPL
Python
跨平台
2015-08-26
debuglife

监视并转换磁盘目录中的 pdf 文档为文本文件,并进行全文检索 python,watchdog,whoosh,,jieba,mongodb,pymongo,pdf2text

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

Solr初级教程

预览 本文档简要介绍如何运行solr,如何进行数据操作。 环境 本教程使用solr 4.9,需要。。。 1. Java 1.7或者更高。 2. 下载solr,地址。 开始 解压solr压缩包,并且进入到“example”文件夹...

2014/07/14 14:21
10.8K
0
lucene之IndexSearcher

索引是现代搜索引擎的核心,建立索引的过程就是把源数据处理成非常方便查询的索引文件的过程。为什么索引这么重要呢,试想你现在要在大量的文档中搜索含有某个关键词的文档,那么如果不建立索...

2015/12/03 17:49
46
0
SOLR 配置

Solr in Action 第四章学习笔记

2014/06/10 11:23
13
0
(一)线程管理_9---线程分组( Thread Group )

线程分组( Thread Group ) Java Concurrent API中提供了对线程进行分组管理的ThreadGroup,使得我们可以将多个线程看作一个单元,对这些线程执行操作,如中断一组线程等; 下面实现一个例子,...

2014/11/12 00:42
38
0
Solr初步实战学习

Lucene索引,分词,存储,查询

2016/10/31 18:45
6
0
go 悟空使用demo

爬了一些当当上的图书信息。用悟空来索引一把,可根据标题, ISBN, 作者来搜索。 先祭出悟空, 感谢huichen大大的开源 [https://github.com/huichen/wukong](https://github.com/huichen/wuk...

2018/01/14 13:59
42
0
whoosh学习(5)

whoosh学习之索引查询

2016/01/15 15:09
345
1
iOS8的一些兼容问题

iOS8,兼容,百度地图的内存泄露问题

2016/03/17 22:12
7
1
whoosh学习(2)

whoosh学习之helloworld

2016/01/15 11:39
670
1

没有更多内容

加载失败,请刷新页面

返回顶部
顶部