元搜索引擎

GPL
Java
跨平台
2015-03-24
杨尚川

元搜索引擎

原搜索引擎是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系统等,我之前做的一个准确率达百分之九十几的人机问答系统的数据源,其中一部分就是充分利用了百度搜索和谷歌搜索。在此演示的技术的基础上,可以容易地扩展到其他的搜索引擎,可以借鉴使用的NekoHTML+XPath或JSoup+CSSPath技术,轻松获取页面的自定义的内容。

应用领域:

1、采集人物信息
2、采集电子报纸
3、使用NekoHTML和XPath解析百度搜索返回结果
4、使用JSoup和CSSPath解析百度搜索返回结果
5、使用Google AJAX API获取谷歌搜索结果

加载中

评论(0)

暂无评论

暂无资讯

4
回答
开源中国的站内搜索是怎么做的,大致流程是怎样的

请问开源中国的站内搜索是怎么做的,大致流程是怎样的?

2016/07/24 21:56

没有更多内容

加载失败,请刷新页面

没有更多内容

ApacheCN 数据科学/人工智能/机器学习知识树 2019.2

【主页】 apachecn.org 【Github】@ApacheCN 暂时下线: 社区 暂时下线: cwiki 知识库 自媒体平台 微博:@ApacheCN 知乎:@ApacheCN CSDN 简书 OSChina 博客园 我们不是 Apache 的官方组织/机...

02/13 22:37
10
0
C#缺省参数可以让代码变得更加简洁明了与时俱进心里敞亮了很多了

以前没有缺省参数这个说法时,为了让别人调用我们的代码方便一些,会写很多构造函数,例如一个查询方法贴一些代码如下: public DataTable Search( string search) { return Search( string.Emp...

2014/04/28 17:13
12
0
windows dir tree 命令

dir /ad /s /b >dir.txt 显示当前位置下所有子目录,结果如下: D:\trans\Trans-Receiver-search\conf D:\trans\Trans-Receiver-search\jdk1.5 D:\trans\Trans-Receiver-search\lib D:\tran...

2013/07/12 16:59
63
0
Web search engines

搜索引擎列表

2014/06/16 12:37
70
0
Xcode项目参数配置——Search Paths

Search Paths 查询路径 Always Search User Paths --- 是否搜索用户路径 Xcode Header Path的设置 Header Search Paths是一定会去搜索的。 而UserHeader Search Paths只有在Always Search U...

2016/03/26 15:19
24
1
【Eclipse】使用指南(18)搜索工作台

搜索Java元素及其引用,所有文件,搜索文本。

2015/07/09 17:45
14
0
<Search Engine Study(1)> Why and when we need?

Lately, I am going to handle a project about building a search engine for whole macau's information data. And I hope doing the research first, and here is my note. Why and When ...

2016/05/07 18:03
56
2
重构旧代码:TACTIC Execl导出

#编者注 在2010年底左右编写的这个功能的代码,在当时为了满足生产部门的需求,只对镜头列表实施了execl导出,并把系统当中的缩略图导出,但是该代码并为按照TACTIC内部逻辑进行实现。问题1...

2016/11/14 13:50
42
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部