元搜索引擎 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
元搜索引擎 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议 GPL
开发语言 Java
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发搜索引擎
开发厂商
地区 国产
提 交 者 杨尚川
适用人群 未知
收录时间 2015-03-24

软件简介

元搜索引擎

原搜索引擎是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系统等,我之前做的一个准确率达百分之九十几的人机问答系统的数据源,其中一部分就是充分利用了百度搜索和谷歌搜索。在此演示的技术的基础上,可以容易地扩展到其他的搜索引擎,可以借鉴使用的NekoHTML+XPath或JSoup+CSSPath技术,轻松获取页面的自定义的内容。

应用领域:

1、采集人物信息
2、采集电子报纸
3、使用NekoHTML和XPath解析百度搜索返回结果
4、使用JSoup和CSSPath解析百度搜索返回结果
5、使用Google AJAX API获取谷歌搜索结果

展开阅读全文

代码

评论 (0)

加载中
更多评论
暂无内容
发表了博客
2013/09/06 17:06

Hibernate Search is a full text search engine

Hibernate Search is a full text search engine built using Apache Lucene framework. Hibernate Search indexes your domain model, keep the index upto date and also performs full text search functionality to fetch matching domain objects. This Hello World example shows how you can setup hibernate sea...

0
2
发表了博客
2011/02/15 11:26

search

1、如果想在自己网站内添加一个google,bing,baidu的搜索框,只对本站进行搜索,则可以用如下操作: key site:website domain 2、html格式在通过邮件服务发送接收时,会加入div,这样会影响里面的内容布局,合适的解决方法是内容全部用table布局。

0
1
发表于服务端专区
01/18 12:41

Search Docker Images with docker search Command

To run docker containers we need images, To find images we can use the docker search command. The docker search command help us search images from the docker public repository. In this docker tutor......

0
0
发表了博客
2015/05/28 16:49

Eclipse Search Files Search 快捷键设置

window->preferences->General->keys。 找到File Search(有搜索框的,可以搜索),然后在下方 Binding按下ctrl +h 。

0
0
发表了博客
04/27 08:38

search(7)- elastic4s-search-filter模式

现在我们可以开始探讨ES的核心环节:搜索search了。search又分filter,query两种模式。filter模式即筛选模式:将符合筛选条件的记录作为结果找出来。query模式则分两个步骤:先筛选,然后对每条符合条件记录进行相似度计算。就是多了个评分过程。如果我们首先要实现传统数据库的查询功能的话,那么用filter模式就足够了。...

0
0
发表了博客
04/27 10:14

search(7)- elastic4s-search-filter模式

现在我们可以开始探讨ES的核心环节:搜索search了。search又分filter,query两种模式。filter模式即筛选模式:将符合筛选条件的记录作为结果找出来。query模式则分两个步骤:先筛选,然后对每条符合条件记录进行相似度计算。就是多了个评分过程。如果我们首先要实现传统数据库的查询功能的话,那么用filter模式就足够了。...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2016/07/24 21:56

开源中国的站内搜索是怎么做的,大致流程是怎样的

请问开源中国的站内搜索是怎么做的,大致流程是怎样的?

4
1
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
0 评论
19 收藏
分享
返回顶部
顶部