HBase 二级索引 hindex

Apache
Java 查看源码»
跨平台
华为
2014-08-20
叶秀兰

hindex 是华为公司开发的纯 Java 编写的 HBase 二级索引,兼容 Apache HBase 0.94.8。

当前的特性如下:

  • 多个表索引

  • 多个列索引

  • 基于部分列值的索引

  • 使用索引扫描等于和范围条件

  • 批量加载数据来索引表(索引完成批量加载)

工作原理

HBase 二级索引是 100% 服务端实现的。

si1

Put 操作

E.g.:

Table –> tab1 column family –> cf

Index –> idx1, cf1:c1 and idx2, cf1:c2

Index table –> tab1_idx (user table name with suffix “_idx” )

si2

扫描操作

si5

si4

使用

IndexedHTableDescriptor htd = new IndexedHTableDescriptor(usertableName);

IndexSpecification iSpec = new IndexSpecification(indexName);

HColumnDescriptor hcd = new HColumnDescriptor(columnFamily);

iSpec.addIndexColumn(hcd, indexColumnQualifier, ValueType.String, 10);

htd.addFamily(hcd);

htd.addIndex(iSpec);

admin.createTable(htd);

未来会实现的功能:

  • 动态添加和删除索引

  • 集成 HBase Shell 的二级索引管理

  • 优化范围扫描

  • HBCK 工具支持二级索引表

  • WAL 优化二级索引条目

  • 使得扫描评估情报可导入导出


的码云指数为
超过 的项目
加载中

评论(2)

beyondyourself
beyondyourself
目前都没什么人commit
金贞花
金贞花
hindex

暂无资讯

暂无问答

h引用(数组中有h个数大于等于h,其余小于)H-Index

问题: Given an array of citations (each citation is a non-negative integer) of a researcher, write a function to compute the researcher's h-index. According to the definition o...

2017/12/19 10:49
7
0
有序数组中的h引用 H-Index II

问题: Follow up for H-Index: What if the citations array is sorted in ascending order? Could you optimize your algorithm? 解决: ① 给定的是有序数组,就不需要排序了。 class So...

2017/12/19 11:17
10
0
274. H-Index - LeetCode

Question 274. H-Index Solution 题目大意: 论文里的 h 因子判定,题目的意思可能有点晦涩。h 因子是评判学术成就的一种重要方法,h 因子越高越好,h 因子兼顾研究学术人员的学术产出数量与...

2018/07/20 10:16
53
0
Hbase 学习(九) 华为二级索引(原理)

Hbase 学习(九) 华为二级索引(原理)

2015/05/11 08:50
5.9K
0
一名开源拓荒者的 Apache 之旅

今年是 Apache 软件基金会20周年庆,作为一家全球性的以开发开源软件为公共利益的慈善组织,正在变得更加的多元化、日渐丰富与完善。从本土软件产业的角度而言,须以站在世界的角度来认识、参...

06/11 15:06
13
0
探秘Runtime - Runtime加载过程

该文章属于<简书 — 刘小壮>原创,转载请注明: <简书 — 刘小壮> https://www.jianshu.com/p/4fb2d7014e9e 程序加载过程 在iOS程序中会用到很多系统的动态库,这些动态库都是动态加载的。所...

2018/11/16 21:53
15
0
Hbase Coprocesor 浅析(一)

1.历史 HBase Coprocessors是参照Google BigTable的coprocessor来实现的。 2.什么是Coprocessor 简单来说,Coprocessor是一个框架,这个框架可以让你很容易地在Region Server运行你的业务逻辑...

2016/08/25 19:37
311
0
HBase高性能复杂条件查询引擎

——索引的实质是另一种编排形式的数据冗余,高效的检索源自于面向查询特别设计的编排形式,如果再辅以分布式的计算框架,就可以支撑起高性能的大数据查询。本文原文出处: http://blog.csdn....

2014/10/12 11:40
97
0

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部