Apache Lucene 4.7.0 发布,全文搜索引擎

oschina
 oschina
发布于 2014年02月27日
收藏 14

Apache Lucene 4.7.0 发布,此版本包括了大量的 bug 修复,系统优化和改进,现已提供下载

值得关注的更新内容如下:

* When sorting by String (SortField.STRING), you can now specify whether
  missing values should be sorted first (the default), or last.

* Add two memory resident dictionaries (FST terms dictionary and FSTOrd
  terms dictionary) to improve primary key lookups. The
  PostingsBaseFormat API is also changed so that term dictionaries get
  the ability to block encode term metadata, and all dictionary
  implementations can now plug in any PostingsBaseFormat.  See
  http://blog.mikemccandless.com/2013/09/lucene-now-has-in-memory-terms.html

* NRT support for file systems that do not have delete on last close or
  cannot delete while referenced semantics.

* Add LongBitSet for managing more than 2.1B bits (otherwise use
  FixedBitSet).

* Speed up Lucene range faceting from O(N) per hit to O(log(N)) per hit
  using segment trees.  See
  http://blog.mikemccandless.com/2013/12/fast-range-faceting-using-segment-trees.html

* Add SearcherTaxonomyManager over search and taxonomy index directories
  (i.e. not only NRT).

* Drilling down or sideways on a Lucene facet range (using
  Range.getFilter()) is now faster for costly filters (uses random
  access, not iteration); range facet counts now accept a fast-match
  filter to avoid computing the value for documents that are out of
  bounds, e.g. using a bounding box filter with distance range faceting.

* Add Analyzer for Kurdish.

* Add Payload support to FileDictionary (Suggest) and make it more
  configurable.

* Add a new BlendedInfixSuggester, which is like AnalyzingInfixSuggester
  but boosts suggestions that matched tokens with lower positions.

* Add SimpleQueryParser: parser for human-entered queries.

* Add multitermquery (wildcards,prefix,etc) to PostingsHighlighter.

* Upgrade to Spatial4j 0.4.1: Parses WKT (including ENVELOPE) with
  extension "BUFFER"; buffering a point results in a Circle. JTS isn't
  needed for WKT any more but remains required for Polygons. New Shapes:
  ShapeCollection and BufferedLineString.  More info:
  https://github.com/spatial4j/spatial4j/blob/master/CHANGES.md

* Add spatial SerializedDVStrategy that serializes a binary
  representation of a shape into BinaryDocValues. It supports exact
  geometry relationship calculations.

* Various bugfixes and optimizations since the 4.6.1 release.


本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:Apache Lucene 4.7.0 发布,全文搜索引擎
加载中

最新评论(7

Jacle
Jacle
2.4还在用
Tanweijie
Tanweijie
那么快。
zheng_pat
zheng_pat
这尼玛速度,真不知道该开心还是害怕
Sky__
Sky__
Lucene确实版本迭代很快,很受不鸟
把妹达人老张
把妹达人老张
版本帝
老骥伏枥-志在千里
老骥伏枥-志在千里
废话我就不说了!
Aoseala
Aoseala
沙发
返回顶部
顶部