百度开源的万亿量级数据库Tera发布0.5.1版本。
Tera简介
Tera是一个高性能、可伸缩的结构化数据存储系统,被设计用来管理搜索引擎万亿量级的超链与网页信息。为实现数据的实时分析与高效访问,我们使用按行键、列名和时间戳全局排序的三维数据模型组织数据,使用多级Cache系统,充分利用新一代服务器硬件大内存、SSD盘和万兆网卡的性能优势,做到模型灵活的同时,实现了高吞吐与水平扩展。
版本要点
将tera的key作为mysql的primary key支持seek
重构SDK头文件,重写大部分注释
SDK成员变量命名风格统一为name_
支持SDK记录当前代码版本
Python SDK支持用户自定义libtera_c.so的路径
支持扩展性更高的manifest格式
写manifest移出lock范围
增强原子计数器的准确度
支持table_cache的大小以size指定
增加cache的profile信息
提供通用的scheduler脚本(负载均衡)
增加tablet状态更新信息支持scheduler对游离tablet的判断
支持元信息的管理和只读权限分离
记录RPC请求的源ip和port
支持测试case的生成和运行分离
升级build脚本以及各个依赖版本
文档:增加SDK各模块文档、单行事务文档,更新onebox文档
问题修复
修复在gcc4下的编译问题
修复enable和disable过程中可能触发的bug
修复多线程负载均衡可能触发的问题
修复线程池1ms定时任务很不准确的问题
修复nexus sdk在lock返回时session id可能变化导致的问题
修复ttlkv表scan提前终止的bug
修复负载均衡过程中master内存变更触发的bug
引用来自“寻梦2012”的评论
这和百度内部用的版本有区别没引用来自“乌龟壳”的评论
这是百度内部搜索引擎用的,还是一个研究性项目开源出来玩的?