Apache Kudu 1.11.0 发布,Hadoop 生态数据存储系统

xplanet
 xplanet
发布于 2019年11月09日
收藏 7

Apache Kudu 1.11.0 发布了,Kudu 是一个支持结构化数据的开源存储引擎,具有低延迟随机读取与高效分析读取模式。它基于 Apache Hadoop 生态系设计,并支持与 Apache 软件基金会其它数据分析项目集成。

此版本带来的新特性包括:

  • Kudu 现在支持维护平板电脑服务器。在此模式下,如果平板电脑服务器的副本失败,将不会重新复制它。仅在退出维护时,才会对任何剩余的复制不足的平板电脑进行复制。新增了 kudu 服务器状态 enter_maintenance 和 kudu 服务器状态 exit_maintenance 工具来编排平板电脑服务器维护,并且 kudu tserver 列表工具已修改为“状态”列选项,以显示每个平板电脑服务器的当前状态 (see KUDU-2069)。
  • Kudu 现在具有内置的 NTP 客户端,该客户端维护用于生成 HybridTime 时间戳的内部墙上时钟时间。启用后,不再需要运行 Kudu 的节点的系统时钟同步。这对于容器化部署很有用,在其他情况下,如果在 Kudu 群集的每个节点上维护正确配置的系统 NTP 服务很麻烦时,它也很有用。使用 --builtin_ntp_servers 标志指定要同步的 NTP 服务器列表。默认情况下,Kudu 主服务器和平板电脑服务器使用 NTP 池项目托管的公共服务器。要使用内置 NTP 客户端,请设置 --time_source=builtin 并在必要时重新配置 --builtin_ntp_servers (see KUDU-2935)。
  • 现在,可通过 Kudu Java 客户端中的 KuduClient.getTableStatistics() 和KuduTable.getTableStatistics() 法以及 Kudu C++ 客户端中的 KuduClient.GetTableStatistics() 向 Kudu 客户端提供汇总表统计信息。这允许进行各种查询优化。例如,Spark 现在使用它来执行联接优化。统计信息可通过 C++ 和 Java Kudu 客户端的 API 获得。此外,可通过 kudu 表统计信息 CLI 工具获得每个表的统计信息。还可以通过主机的 Web UI 在 master:8051/metrics and master:8051/table?id=<uuid> URI上获得统计信息 (see KUDU-2797 and KUDU-2921)。
  • kudu CLI 工具现在支持更改表列。使用新引入的子命令,例如  kudu table column_set_defaultkudu table column_remove_defaultkudu table column_set_compressionkudu table column_set_encoding,和 kudu table column_set_block_size 来更改指定表的列。
  • kudu CLI 工具现在支持删除表列。 使用新引入的 kudu table delete_column 子命令删除指定表的列。
  • kudu CLI 工具现在支持获取和设置表的其他配置属性。 使用 kudu table get_extra_configs 和 kudu table set_extra_config 子命令执行相应的操作 (see KUDU-2514)。
  • kudu CLI 工具现在支持为表创建和删除范围分区。 使用 kudu table add_range_partition 和 kudu table drop_range_partition 子命令来执行相应的操作 (see KUDU-2881)。

更新说明:https://kudu.apache.org/releases/1.11.0/docs/release_notes.html

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:Apache Kudu 1.11.0 发布,Hadoop 生态数据存储系统
加载中
返回顶部
顶部