《说透 Kubernetes 云原生监控》系列文章,交流收藏

vps网友提供 10-04 讨论归档 13

云原生监控系列文章:《说透 Kubernetes 云原生监控》

连载:《说透运维监控系统》

注:

  1. 以上系列文章,均以开源监控系统——夜莺监控为例,你也可以对照 Prometheus 或者 zabbix 做相关的理解。

  2. 基于夜莺监控制作的一些 dashboard ,可以参考如下:

  • K8s apiserver dashboard with nightingale K8s apiserver dashboard
  • K8s scheduler dashboard with nightingale K8s scheduler dashboard
  • K8s controller manager dashboard with nightingale K8s controller manager
  • K8s etcd dashboard with nightingale K8s etcd dashboard

本文由 vps网友提供,转载请注明出处

本文链接: https://www.vpsvsvps.com/discuss/a/1676472107782901760.html

标签:
laiwei
10-30

追加一篇文章《 Zabbix 和夜莺监控选型对比》 http://flashcat.cloud/blog/zabbx-vs-nightingale/,来自 Zabbix 社区专家张世宏,张世宏也是 Nightingale 社区活跃贡献者。

wuleiisme
10-30

看起来挺不错,最近正好有需求

wsszh
10-28

支持

laiwei
10-11

看到很多 v 友收藏,谢谢,我会继续 append 这个主题。

laiwei
10-05

@pavelpiero

是的,业务层面的监控,很多需要在业务代码层面主动埋点(不过好消息是埋点的工作量,借助于 open telemetry ,已经可以降低到足够低了,且都是标准化的方案)

但是对于各种基础设施、中间件、云资源,这些监控,不需要百花齐放百家争鸣,尽可能选择最佳实践,开箱即用是更好的。

laiwei
10-05

@plko345 Prometheus 是一个挺好的工具,但是也存在一些痛点:

1. ‌功能相对单一,产品化程度低,难以开箱即用;
> 举个例子:可视化一般必须配合 grafana 来工作,告警一般也需要配合 alert manager 来一起工作,且告警策略的改动都需要修改配置文件。夜莺监控把数据采集、可视化、告警管理这些基本能力,都做成了 all-in-one 的产品化方案。

2. ‌数据量过大时,官方缺乏合适的扩展性方案;

3. ‌多集群管理功能缺失;

plko345
10-05

为什么不用云原生的 prometheus ,国际化一点

pavelpiero
10-05

原生监控只是开始 后续需要做针对性地开发

laiwei
10-04

@YaakovZiv 系列文章都会在公众号上发,公众号是 flashcats 。

不过也会在 https://n9e.github.io 和 http://flashcat.cloud 上做归档。

YaakovZiv
10-04

除了微信公众号,还有其他地方可以看吗,微信公众号加载挺慢的,有你们自己的博客网站吗

crazychang
10-04

收藏即学习

laiwei
10-04

@LeoJ :) 云原生监控,open-falcon 稍微有点力不从心(更适合物理机时代),夜莺监控是更好的选择了

LeoJ
10-04

支持一下 open-falcon~