Rainbond V3.7.1 发布,零配置支持全方位集群资源监控与报警

好雨云帮
 好雨云帮
发布于 2018年09月05日
收藏 13

Rainbond 是一款以应用为中心的开源PaaS,由好雨基于Docker、Kubernetes等容器技术自主研发,可作为企业在公有云或私有云环境下的应用交付平台、DevOps平台、自动化运维平台和行业云平台,或作为企业级的混合云多云管理工具、Kubernetes容器管理工具或Service Mesh微服务架构治理工具。

继Rainbond V3.7.0版本大量提高平台稳定性更新后,我们又推出了V3.7.1版本,本次更新进一步完善集群全方位的监控与报警体系。Rainbond集群需要监控的目标分为三类:

  • 节点操作系统和硬件指标

    Rainbond每个节点的资源使用情况和健康状况的监控和快速发现故障对于Rainbond运维人员来说是非常必要的。Rainbond Node服务集成了node-exporter,运行于所有节点之上,暴露出经过精简的Prometheus规范的操作系统和硬件的指标。

  • 管理服务监控指标

    Rainbond所有服务和第三方服务都提供了Prometheus的exporter API,以暴露当前服务的关键监控指标。

  • 应用容器资源指标

    应用运行的实例容器的资源占用情况(内存、CPU、IO、Net)虽然不能直接体现应用的负载情况,但可以配合应用业务级性能分析定位应用问题。容器的监控具有特殊性,容器是一个飘忽不定的监控目标。应用是确定的。因此Rainbond监控的维度是应用级容器。当前版本采用收集Kubelet集成的Cadvisor收集的容器监控指标。但其由于监控指标比较丰富,大多数情况下监控系统会冗余大量无用数据。Rainbond后续版本将精简容器监控指标。

Rainbond 提供了rbd-monitor组件,组件由monitor进程服务和Prometheus服务组成。monitor服务有以下几方面工作:

  • 自动发现三方面监控目标。

  • 自动生成监控目标Prometheus配置并生效。

  • 提供配置报警规则的API服务,并自动设置Prometheus生效。用户可以通过grctl命令方便设置报警规则。

  • 自动对监控目标进行自动分类,集群统筹数据分区,以解决单机监控目标数有限问题。[TODO]

  • 对外提供集群负载的查询API, 屏蔽底层Prometheus的数据分区差异,类似于项目thanos [TODO]

Rbd-monitor提供的查询API, 数据显示方面可对接Grafana进行可视化,对接Altermanager进行报警信息处理。

instance-monitor

应用实例内存使用占比

instance-monitor

容器资源监控

instance-monitor

操作系统和硬件指标监控

instance-alerting

除此之外,当前版本还带来了一系列改进:进一步优化源码构建体系,支持SVN基于Tag方式构建应用、支持Maven的子项目构建、改进源码构建容器的创建策略,使用原始代码创建容器替换掉调用docker run命令以解决之前版本关于复杂构建变量无法传入的问题。为方便用户调试源码,支持使用grctl工具对源码进行脱离平台的检查和构建。通过简单的命令快速验证源码是否符合Rainbond要求。

另外,借鉴广大企业用户对于Rainbond产品的使用体验的反馈,支持了应用的批量删除与批量移动组别、优化日志推送与存储、支持更改数据中心内部仓库域名等功能。

具体更新清单如下:

新增功能

  1. 增加应用实例所创建容器的资源指标 【文档】

  2. 增加节点操作系统和硬件指标监控 【文档】

  3. 增加各服务组件健康监控 【文档】

  4. 增加应用异常事件的查询与处理 【文档】

  5. 增加控制台可视化应用每个实例的内存使用情况 【文档】

  6. 增加支持自定义Prometheus报警规则 【文档】

  7. 增加monitor组件与Alertmanager的对接支持 【文档】

  8. 增加对SVN基于Tag版本选择构建的支持 【文档】

  9. 增加支持更改数据中心内部仓库域名 【文档】

  10. 增加批量删除应用,批量移动分组功能 【文档】

  11. 增加grctl命令行工具支持源码构建测试 【文档】

  12. 改进操作日志和构建日志的推送与存储

  13. 改进源码构建容器的构建策略,支持更多的参数传入

已知问题修复

  1. 应用导出时存在的bug

  2. grctl获取应用信息时的信息缺失

  3. 自动部署提供的URL错误

  4. 解决了应用备份由于版本不存在导致的bug

关于Rainbond 5.X的RaodMap的草案讨论

Rainbond至开源以来,深受社区用户的欢迎,已经有大量企业用户尝试使用Rainbond作为企业产品开发,架构,运维和交付的重要基础平台。Rainbond在经历了3.X 系列7个版本的迭代周期以后,即将进入5.X版本周期。Rainbond团队将在Rainbond 5.X体系中深入与社区生态结合。你是否关注PaaS、Kubernetes, 微服务架构领域呢?

点击查看并参与Rainbond 5.X版本规划:

About Rainbond 5.X RoadMap Community needs collection

了解更多

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Rainbond V3.7.1 发布,零配置支持全方位集群资源监控与报警
加载中
返回顶部
顶部