Nightingale 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
Nightingale 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
Nightingale 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache
开发语言 Google Go TypeScript
操作系统 跨平台
软件类型 开源软件
所属分类 管理和监控系统监控
开源组织 滴滴出行
地区 国产
投 递 者 快猫星云
适用人群 未知
收录时间 2020-03-23

软件简介

夜莺(Nightingale)是一个企业级监控解决方案。旨在满足云原生时代企业级的监控需求。Nightingale 在产品完成度、系统高可用、以及用户体验方面,达到了企业级的要求,可满足不同规模用户的场景,小到几台服务,大到数十万都可以完美支撑。兼顾云原生和裸金属,支持应用监控和系统监控,插件机制灵活,插件丰富完善,具有高度的灵活性和可扩展性。

Nightingale 最初由滴滴开源,后来捐赠给中国计算机学会开源发展委员会(建成CCF ODC),是CCF ODC首个接受产业界捐赠的开源项目。

Nightingale 在 Open-Falcon 的基础上,结合滴滴内部的最佳实践,在性能、可维护性、易用性方面做了大量的改进,作为集团统一的监控解决方案,支撑了滴滴内部数十亿监控指标,覆盖了从系统、容器、到应用等各层面的监控需求,周活跃用户数千。五年磨一剑,取之开源,回馈开源。

产品特点

开箱即用

内置监控大盘、快捷视图、告警规则,导入即可快速使用,广大社区用户也在持续完善,将最佳实践内置于产品

兼容并包

可以和 Prometheus、Categraf、Telegraf、Datadog-Agent、VictoriaMetrics、M3DB 等无缝集成

高性能

得益于新时代的高性能时序库,和夜莺引擎侧优秀的设计,单机轻松扛起百万Series,节省企业大量成本

水平扩展

服务端组件均可水平扩展,无单点风险;亦可将时序库、告警引擎下沉到各个机房,从地域、业务层拆分

经受打磨

夜莺监控已经在上千家企业部署落地,经受了生产实践打磨,有些企业的夜莺集群达几十台机器,处理十亿级Series

社区活跃

托管于中国计算机学会开源发展委员会,有快猫星云商业公司持续投入,夜莺项目具有持久生命力

产品介绍

Nightingale 可以接收各种采集器上报的监控数据,转存到时序库(可以支持Prometheus、M3DB、VictoriaMetrics、Thanos等),并提供告警规则、屏蔽规则、订阅规则的配置能力,提供监控数据的查看能力,提供告警自愈机制(告警触发之后自动回调某个webhook地址或者执行某个脚本),提供历史告警事件的存储管理、分组查看的能力。

系统截图

系统架构

莺 v5 的设计非常简单,核心是 server 和 webapi 两个模块,webapi 无状态,放到中心端,承接前端请求,将用户配置写入数据库;server 是告警引擎和数据转发模块,一般随着时序库走,一个时序库就对应一套 server,每套 server 可以只用一个实例,也可以多个实例组成集群,server 可以接收 Categraf、Telegraf、Grafana-Agent、Datadog-Agent、Falcon-Plugins 上报的数据,写入后端时序库,周期性从数据库同步告警规则,然后查询时序库做告警判断。每套 server 依赖一个 redis。

产品对比

Zabbix 
Zabbix 是一款老牌的监控系统,对机器和网络设备的监控覆盖很全,比如支持 AIX 系统,常见的开源监控都是支持 Linux、Windows,AIX 较少能够支持,Zabbix 用户群体广泛,国内很多公司基于 Zabbix 做商业化服务,不过 Zabbix 使用数据库做存储,容量有限,今年推出的 TimescaleDB 对容量有较大提升,大家可以尝试下;其次 Zabbix 整个产品设计是面向静态资产的,在云原生场景下显得力不从心。

Open-Falcon 
因为开发 Open-Falcon 和 Nightingale 的是一拨人,所以很多社区伙伴会比较好奇,为何要新做一个监控开源软件。核心点是 Open-Falcon 和 Nightingale 的差异点实在是太大了,Nightingale 并非是 Open-Falcon 设计逻辑的一个延续,就看做两个不同的软件就好。

Open-Falcon 是 14 年开发的,当时是想解决 Zabbix 的一些容量问题,可以看做是物理机时代的产物,整个设计偏向运维视角,虽然数据结构上已经开始设计了标签,但是查询语法还是比较简单,无法应对比较复杂的场景。

Nightingale 直接支持 PromQL,支持 Prometheus、M3DB、VictoriaMetrics 多种时序库,支持 Categraf、Telegraf、Datadog-Agent、Grafana-Agent 做监控数据采集,支持 Grafana 看图,整个设计更加云原生。

Prometheus 
Nightingale 可以简单看做是 Prometheus 的一个企业级版本,把 Prometheus 当做 Nightingale 的一个内部组件(时序库),当然,也不是必须的,时序库除了 Prometheus,还可以使用 VictoriaMetrics、M3DB 等,各种 Exporter 采集器也可以继续使用。

Nightingale 可以接入多个 Prometheus,可以允许用户在页面上配置告警规则、屏蔽规则、订阅规则,在页面上查看告警事件、做告警事件聚合统计,配置告警自愈机制,管理监控对象,配置监控大盘等,就把 Nightingale 看做是 Prometheus 的一个 WEBUI 也是可以的,不过实际上,它远远不止是一个 WEBUI,用一下就会深有感触。

联系我们 

致谢和说明

  • Open-Falcon 是小米运维团队开源的企业级监控解决方案,在国内广泛使用。
  • Nightingale 采用 Apache-2.0 开源协议。
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击加入讨论🔥(17) 发布并加入讨论🔥
发表了资讯
08/28 08:37

夜莺项目发布 v6.1.0 版本,增强可观测性数据串联

大家好,夜莺项目发布 v6.1.0 版本,这是一个中版本迭代,不止是 bugfix 了,而是引入了既有功能的增强。具体增强了什么功能,下面一一介绍。 1. 增强可观测性数据串联 从 v6.1.0 开始,对日志索引模式做了增强,支持设置某个字段的展示格式为 URL,配置方式如下: {{value}} 就是这个字段原始的值,可以把这个字段拼接到 URL 中,把这个字段展示成链接,这样用户在查看日志数据的时候,通过这个链接,就可以跳转到某个其他页面...

0
0
发表了资讯
08/21 11:25

夜莺监控发布 v6.0.3 版本,增强告警订阅功能

简介 夜莺项目发布v6.0.3版本,增强了一些功能,修复了一些bug,访问夜莺下载中心下载体验。 升级内容 1. 优化告警订阅逻辑 去掉了告警类别字段,因为从订阅角度,告警事件不太需要区分 Metric 和 Host 类别做不同的订阅规则,即使真的需要,也可以通过事件标签来区分。新版本只有事件级别是必填筛选项,其他所有的筛选项都是可选的,给用户足够的灵活度。 2. 优化大盘全屏展示效果 全屏展示大都是用于投放电视大屏,不需要在大...

1
4
发表了资讯
08/14 09:03

夜莺项目发布v6.0.2版本,增强日志查看能力

简介 夜莺项目发布v6.0.2版本,增强了一些功能,修复了一些bug,访问夜莺下载中心下载体验。 升级内容 1. 仪表盘图表面板支持检查查询数据和图表配置 这是一个调试功能,很多小伙伴对于通过 chrome 开发者工具查看 HTTP 请求和响应不太熟悉。这个版本我们内置了这个调试功能,方便大家调试。 右键大盘图表,可以看到【排查】按钮,点击后会弹出一个窗口,里面包含了图表的配置和request、response。 通过这个调试功能,我们可以...

0
2
发表了资讯
08/07 17:19

可观测性平台夜莺开源项目发布 V6 正式版!

夜莺开源项目在2023.7月底发布了V6版本,这个版本开始,项目目标不止于做一款开源监控系统,而是要做一款开源可观测性平台,不过路漫漫其修远兮,初期只是把日志数据源引入并完成了基本的可视化,后续会着力打通指标和日志的数据串联以及数据特征提取。欢迎小伙伴一起参与共建。 夜莺V6版本开发了好几个月了,于2023.7月底发布了正式版,今天是8.7号,实际最新版本已经是v6.0.1了,V6相比之前的版本有重大的改进。本文给大家做一...

3
9
发表了资讯
07/07 09:54

夜莺可观测性平台发布 v6.ga13 版本,正式版月底发布

What’s Changed feat: 告警信息支持通过 stdin 传递给 ibex 可以更方便地实现故障自愈 by tanxiao1990 feat: 心跳时间支持从 heartbeat 接口提取,提高了心跳时间实时性 by qifenggang feat: 登录密码支持 RSA 加密 by masterjyq feat: 时序图表格模式 Legend 支持下钻链接 by masterjyq refactor: 修改数据源类型和值后保存到 URL querystring refactor: 大盘详情页面标题设置为大盘标题 refactor: 大盘数据源变量支持正则过滤...

0
0
发表了资讯
06/13 11:15

夜莺监控发布 v6.0.0.ga.10 版本

What’s Changed feat(biz-group): 业务组名称设置成 分组名-名称 格式后业务组列表自动以分组形态展示 refactor(quick-view): 快捷视图样式优化,修复规则名称或标签值过长会渲染错位问题 refactor(quick-view): 图表面板标题栏新增图标可查看当前图表完整的 PromQL refactor(account): 更多联系方式处添加链接可跳转到联系方式配置页面 refactor(event): 本地缓存查询的时间范围 fix(explorer): 修复 ES 8.x 查询报 “unknown...

0
2
发表了资讯
04/28 11:13

夜莺监控观测平台发布 v6.0.0.ga.6 版本,正式版越来越近了

What’s Changed feat: 饼图支持配置是否显示指标值和设置单位、小数位数 @masterjyq feat: 监控大盘变量新增别名设置 feat: 支持机器自动分组,在 categraf config.toml 的 heartbeat url 后面加上 ?gid=x 就可以根据业务组 ID 自动分组了 feat: 机器列表增加心跳时间和来源 ip 字段 refactor: 告警策略通知组选择支持关键词过滤 refactor: 告警策略指标监控设置默认告警级别 refactor: 通知模板更新增加校验逻辑 fix: 修复活跃...

1
4
发表了资讯
04/15 19:04

夜莺监控观测平台发布 v6.0.0.ga.4 版本

What’s Changed feat: 监控大盘 Elasticsearch 源卡片查询条件支持 sortBy 配置 refactor: 新增大盘迁移工具页面,从 ga.4 开始大盘详情页面去除了右上角全局的 Prometheus 集群切换,可通过数据源变量来实现全局切换数据源。新增的大盘迁移工具可批量迁移业务组里面所有的大盘,也可在大盘详情页单独迁移 refactor: Elasticsearch 源查询索引结果排序 refactor: 订阅告警规则界面的告警规则表格列信息更新 refactor: 优化所有...

0
4
发表了资讯
04/08 08:26

夜莺监控观测平台发布 v6.0.0.ga.3 版本

What’s Changed fix: 对接 6.0+、7.0+ 版本 ES,查询日志报错 fix: 链路追踪页面 Traces 排序问题 fix: 数据上报一段时间之后出现中断 fix: 请求 ES 跳过 SSL 验证不生效 #1457 by @idcdog fix: 告警规则中附加标签变量配置不合理时,程序会异常退出 fix: 机器失联告警,事件中缺少自定义标签 docs: 一些文案调整优化 从 ga.2 升级到 ga.3 alter table `chart_share` add datasource_id bigint unsigned not null default 0;...

4
12
发表了资讯
03/21 10:09

不止于监控,夜莺 V6 全新升级为开源观测平台

不止于监控,夜莺 V6 来了!今天我们郑重发布夜莺 6.0 beta 版本,全面支持 Metrics、Logging、Tracing,向着构建开源、开放、完整的可观测性解决方案迈进。您可以借助夜莺 V6,接入和管理 Prometheus、ElasticSearch、Jaeger 多种数据源,实现数据的统一可视化、告警和分析。 🚀 可以在页面管理数据源了 无需修改配置文件里的Clusters配置了,直接在页面就可以管理了。除了兼容 Prometheus 查询协议的数据源,也支持 Ja...

8
25
发表了资讯
2022/06/21 14:26

云原生监控系统·夜莺近期新功能一览,解决多个生产痛点

前置介绍 Nightingale | 夜莺监控,一款先进的开源云原生监控分析系统,采用 All-In-One 的设计,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析和告警能力。于 2022 年 5 月 11 日,捐赠予中国计算机学会开源发展委员会(CCF ODC),为 CCF ODC 成立后接受捐赠的首个开源项目。 写在前面 Nightingale 的定位,是企业级 Prometheus,不是说 Prometheus 不好。举个例子,比如...

0
7
发表了资讯
2022/06/09 17:01

夜莺监控成为首个 CCF 托管开源项目

夜莺监控(Nightingale)是一款开源云原生监控分析系统。采用 All-In-One 的设计,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,提供开箱即用的企业级监控分析能力。已有众多用户选择将Prometheus + AlertManager + Grafana 的开源组合方案升级为使用夜莺监控方案。 2022年5月11日,中国计算机学会(下文简称“CCF”)在中科院计算所报告厅举行了夜莺监控开源项目捐赠仪式,夜莺监控成为CCF开源发展委...

2
17
发表了资讯
2022/02/15 17:47

滴滴开源监控系统夜莺发布 5.3.4,新功能真香

夜莺5.0发版之后,前面两周社区反馈了一些问题,做了集中修复系统很快稳定了,感谢社区小伙伴们的支持。近期又增加了一些新的优化项,这里给大家罗列一下,有兴趣的小伙伴可以升级尝试。 注意:如果是从低版本升级上来,要注意查看github的releases页面,挨个执行各个版本的SQL变更,二进制和前端静态资源文件可以一次性升级到最新版 支持了grafana-agent作为采集器 很多小伙伴可能习惯使用Prometheus的各类exporter,但是这些e...

7
22
发表了资讯
2022/01/03 12:57

滴滴夜莺监控发布 v5 正式版,定位 Prometheus 企业版

大家好,经过几个月的研发,夜莺v5正式版跟大家见面了,这个版本做了巨大的产品定位调整,不再是一个运维平台,而是专注监控告警这个细分领域,拥抱Prometheus生态,争取把监控这个事情,做到极致!这是新版的截图,给大家一个直观的认识先。 这个版本的功能设计全部是围绕监控告警来的,比如告警规则、屏蔽规则、订阅规则的管理,活跃告警、历史告警的查看,监控数据查看,提供不同的看图视角,监控对象的管理,告警自愈机制,...

24
58
发表于运维专区
2021/04/16 15:28

国产监控夜莺 v4 来了,大幅降低部署维护难度

大家好,经过2个月的开发,夜莺v4来了,欢迎大家试用。本文为大家介绍一下开发v4的背景、最新模块组成、升级建议,同时演示一下单机快速部署的方式。如果朋友是第一次尝试夜莺,可以按照后面讲解的部署方式来搞,5分钟搞定。 演进背景 v3版本融入了很多运维平台的功能,组件变多,部署麻烦,不同的组件相互之间有调用关系,在做分布式部署的时候需要了解整体架构才能正确修改配置文件,对用户提出了较高的要求。很多issue和群里...

13
62
发表于运维专区
2020/12/10 13:08

滴滴夜莺运维平台发布 3.3.1 版本

最大的功能点是后端存储支持了M3DB,M3是uber开源的一款时序数据库,在uber内部号称处理了66亿监控指标,扩缩容非常方便、容灾也做的很好,跟夜莺默认使用的rrd版本相比,对硬盘IO的要求更小,但是存储的是原始数据,会占用更多硬盘空间,非常值得一试。其他升级点如下: 前端 fix: 修复IE11兼容问题,目前支持 IE >= 11,Chrome >= 70 fix(mon): 修复屏蔽策略无法选择屏蔽节点问题 fix(mon): 修复某些日志采集修改会导致名称被...

0
8
2020/10/08 20:43

滴滴夜莺发布 v3 版本,从运维监控演化成了运维平台

Nightingale 从 3 月份开源到现在,过去了半年多点时间,收获了接近 2000 个 github star,300 多个 issue,感谢各位业界同仁的关注和社区参与。 经过慎重考虑,我们决定把商业版本中的更多功能拿出来开源,组成一个轻量级运维平台,这块业界的开源解决方案较少,我们希望贡献一份自己的力量。除了已有的监控告警的能力,又引入了如下功能模块: 用户资源中心:提供完备的用户信息管理、组织结构管理、组织权限管理、组织资源管...

6
47
发表于运维专区
2020/05/30 22:00

运维监控系统 Nightingale 2.4.1 发布,支持对接 Grafana

Nightingale是滴滴开源的一款运维监控系统,是Open-Falcon的下一代,融入了滴滴的生产实践经验,适用于大规模监控场景。产品完善度很高,集采集、传输、存储、查询、告警、事件处理、告警自愈于一体,是一款开箱即用的运维监控解决方案。 2.4.1版本更新内容: 支持了Grafana作为绘图展示工具,可以在Grafana里配置Nightingale作为数据源。Grafana针对Nightingale的数据源插件:https://github.com/n9e/grafana-n9e-datasource 增...

2
25
发表于运维专区
2020/05/21 08:41

Nightingale 2.2.0 发布,滴滴开源运维监控系统

Nightingale从正式发布到今天5.21号,差不多两个月左右的时间,社区用户参与热情很高,发布了多个版本,最新版本已经到了2.2.0,这里罗列一下相关改进,供大家参考,欢迎大家参与到Nightingale的建设中来,我们希望与社区一起,把监控这个事情,做到极致。 进程采集不但支持采集进程数目,也支持采集进程cpu和mem占用 页面上支持了plugin的配置,可以给plugin脚本传参,通过配置也可以指定只启用部分节点下的plugin 服务端接收到...

10
23
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
17 评论
501 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部