Xapian 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Xapian 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议 GPL
开发语言 C/C++
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发搜索引擎
开发厂商
地区 不详
提 交 者 不详
适用人群 未知
收录时间 2009-01-09

软件简介

Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。

Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/

Xapian除了提供原生的C++编程接口之外,还提供了Perl,PHP,Python和Ruby编程接口和相应的类库,所以你可以直接从自己喜欢的脚本编程语言当中使用Xapian进行全文检索了。

展开阅读全文

评论 (0)

加载中
更多评论
暂无内容
发表了博客
2012/10/12 08:31

XAPIAN

http://www.162cm.com/p/xapian-learning.html 这是关于xapian的相关介绍。 一款不错的分词库http://zuroc.42qu.com/po/blog/10735618

0
0
发表了博客
2019/02/19 18:52

Xapian使用入门

  关键字:搜索引擎、Xapian   一篇拖了两三年的入门总结文章,今天发出来,一方面是自己的总结,另一方面是给自己和他人的备忘。读者需要对搜索引擎有初步了解,譬如了解倒排、term、doc、相似度打分等概念。 Xapian是一个C++搜索引擎内核,提供了类似Lucene的功能,功能没有Lucene丰富,但可以满足常见的搜索需求:...

0
0
发表了博客
2019/02/22 12:49

Xapian的内存索引

  关键字:xapian、内存索引   xapian除了提供用于生产环境的磁盘索引,也提供了内存索引(InMemoryDatabase)。内存索引。我们可以通过观察内存索引的设计,来了解xapian的设计思路。 1 用途   官方文档说法:   “inmemory, This type is a database held entirely in memory. It was originally written for ...

0
0
发表了博客
2018/03/04 21:28

XAPIAN简单介绍(三)

今天主要介绍的是Xapian::Database这个类。先上图 看上去就非常恐怖的吧,我们一点点的说。 首先一切的開始都来自那个include目录中的database.h,他的直接实现是在omdatabase.cc中,此外在common目录中另一个database.h这个文件是DataBase的私有类指针的声明,在backends/database.cc中给出了这个私有类的实现,当然这个...

0
0
发表了博客
2019/03/03 22:16

Xapian的内存索引-添加文档

本文主要记录Xapian的内存索引在添加文档过程中,做了哪些事情。 内容主要为函数执行过程中的流水线。 demo代码: Xapian::WritableDatabase db = Xapian::InMemory::open(); Xapian::Document doc; // 添加文档的,T表示字段名字,TERM内容为世界,position为1 doc.add_posting("T世界", 1); d...

0
0
发表了博客
2013/10/25 10:26

xapian-xunsearch的后端

Xapian 是一款开源的C++信息检索系统,内部系统试用了xunsearch,因此稍微了解了一下“虾片”的机制 先看一下执行过程: 检索相关: Xapian::Database 用于读取索引。 Xapian::Enquire 提供检索服务,与Xapian::Database配合使用 Xapian::QueryParser 查询语句解析器 Xapian::Query 查询语句 Xapian::MSet 检索返回的匹配...

0
3
发表了博客
2019/03/10 23:58

Xapian索引-文档检索过程分析

本文是Xapian检索过程的分析,本文内容中源码比较多。检索过程,总的来说就是拉取倒排链,取得合法doc,然后做打分排序的过程。 1 理论分析 1.1 检索语法 面对不同的检索业务,我们会有多种检索需求,譬如:要求A term和B term都在Doc中出现;要求A term或者B term任意在Doc中出现;要求A term或者B term任意在Doc出现,...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2009/05/18 13:30

利用Xapian构建自己的搜索引擎:Xapian简介

Xapian与开源 Xapian的官方网站是http://www.xapian.org,这是一个非常优秀的开源搜索引擎项目,搜索引擎其实只是一个通俗的说法,正式的说法其实是IR(Information Retrieval)系统。Xapian的License是GPL,这意味着允许使用者自由地修改其源码并发布之。Xapian的中文资料非常少,可以说现在互联网上连一篇完整详细的X...

3
5
发表了问答
2010/12/25 12:04

win7 x64 vs2008无法编译xapain,请指教

参考了Building Xapian & the C# bindings for 64bit Windows 环境已经按要求安装,一直找不到问题所在! MSYS+MINGW也无法编译,真是奇怪了! Setting environment for using Microsoft Visual Studio 2008 x86 tools. C:\Program Files (x86)\Microsoft Visual Studio 9.0\VC>cd\ C:\>d: D:\>cd xapian D:\xapian>cd ...

1
1
发表了问答
2013/08/08 12:01

DatabaseLock Error

terminate called after throwing an instance of 'Xapian::DatabaseLockError' 这是什么原因造成的,怎么解决?

1
0
发表了问答
2013/08/01 16:28

xapian建立索引

xapian对于多个txt文档建立索引时,能否加入行号信息?以达到具体定位到哪一个文件的哪一行吗?

4
0
发表了问答
2013/07/26 11:00

xapian如何定位信息

我的数据源是日志文件,每一条日志一行内容,如何搜索定位到准确的行号,而且在终端只显示出包含有此关键字的一行内容,而不是把该文档的内容全部列出呢?

1
0
发表了问答
2011/12/15 21:16

xapian clucene 应该用哪个?

想选个c++ 的搜索引擎,主要用于自己网站内容的检索,xapian clucene 哪个好点,请各位用过的高手指点一下?

3
0
发表了问答
2011/09/23 13:52

xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

经过 2 周如火如荼的测试和修正,很高兴如期发布 xunsearch-1.0.0 正式稳定版,这也是 xunsearch 的第一个正式版本。 Xunsearch 是免费开源的专业全文检索解决方案,旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验...

3
6
发表了问答
2012/01/10 20:44

xapian的QueryParser能不能切分数字单词混合的字符窜

比如 "xxx v1.0", parse_query出来的就是xxx和v1.0 单独搜1.0搜不到 现在想到的办法是匹配无结果就从get_spelling_suggestion里取,或者自己切分 请问xapian本身有没有提供另外的解决方案?

1
0
发表了问答
2011/09/09 17:32

发布 xunsearch-1.0.0b 测试版(全文检索,基于xapian和scws)

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低 服务器搜索负荷、极大程度的提高搜索速度和 用户体验。 支持海量数据高速检索,功能强大,简单易用,而且...

3
2
发表了问答
2010/11/13 08:10

[IBM DW] 用 Xapian 和 Omega 读取并索引文档

简介: 存储并提供对文档和信息的访问是很多公司都面临的一个日益严重的问题。解决这个问题有很多解决方案,包括 wikis 和结构化了的文档存储,但全文本索引通常是从大量文档中获取信息的惟一方式。Xapian 是一种开源工具,可读取并索引文档,包括 HTML、PDF、 OpenOffice、Microsoft® Office® 等格式的文档,而且还具...

2
1
发表了问答
2009/05/25 10:08

利用Xapian构建自己的搜索引擎:检索

经过前面几篇的介绍,如果再参考一下Omega的话,估计应该可以顺利创建database和往database里添加document了。有了数据,下一步关心的当然是怎样将它们查出来,在一个IR系统(不单止Xapian)中,检索的方式是多元化的,排序则是多样化的,结果则是人性化的,这就是跟关系数据库相比的最大优势。由于内容较多,因此将检索...

2
4
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
0 评论
117 收藏
分享
返回顶部
顶部