云主机和k8s-node的监控方案.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

云主机和k8snode的监控方案

?

?

400台云主机+100台k8s的node,用什么方案监控好呢?Zabbix?Prometheus?还是两套都上?

问题来自社区会员,探讨来自twt社区众多同行的分享,欢迎大家参与交流,各抒己见。*“争议”栏目内容来自同行分享的一手体验和观察,仅代表个人观点

@jason2006xu昆仑银行技术经理:

个人建议直接上Prometheus,理由如下:

1、Prometheus可以监控主机(cpu、内存、磁盘空间等)、网络。

2、Prometheus是K8s的孪生兄弟,可以监控docker、pod,还有master,比zabbix有天然优势。

3、400台云主机+100个node纳管数量对于Prometheus不是问题。

4、Prometheus可以定制开发exporter轻松实现采集代理定制开发。

@jiaoyutwt?系统运维工程师:

400台云主机+100台k8s的node。没有说要监控容器,监控的是节点与主机。Zabbix和Prometheus都可以。推荐Zabbix,如果要监控容器,当然用Prometheus,不过现在Zabbix也支持监控k8s,要看模板的支持度能否满足自己的监控需要。自己是做IT基础设施的,当然比较偏向Zabbix,对硬件监控支持度更好、更全面。

@天衣无缝杭州市中医院工程师:

上只能建议上一套,两个同时上性能开销太大,资源利用率随之下降,两者选其一即可。Prometheus呢直接原生的方案可以直接搞定大批量的资源监控并发,Zabbix呢可能因为并发的限制要稍微设计下架构。

@qiuhaovs?交互工程师:

prometheus是最棒的方案,如果你python和go特别好的话,还可以做定制化。

@xylonxiang湖南高阳通联运维经理:

如果没有特殊要求,建议使用Prometheus监控体系就可以了,只不过部署方案上可能是部署两套。

Prometheus,一套在k8s集群外,一套在k8s集群内,通过Prometheus联邦方式把监控数据集中到k8s集群外的Prometheus中,再配置相应的监控告警规则。

@zhangfan13cmbc中国民生银行项目经理:

容器云平台的监控首选Prometheus。

从监控指标这个角度,因为Prometheus天然就和k8s监控做了集成,监控指标几乎是开箱即用(这点是最重要的,不管k8s如何升级迭代,我们都不用花精力去适配开发监控指标,因为k8s已经提供了基于Prometheus的专业监控能力),一些特殊的监控需求也可以定制开发exporter来实现。

从性能容量这个角度看,400台云主机+100台k8s的node只能算是比较小规模的环境了,一套Prometheusserver完全够用,如果后续规模扩大,可以通过Prometheusserver集群的方式来扩大性能容量,支撑能力完全没问题。

从以上两个角度看,只用Prometheus就够了,除非你的项目之前主要使用的是Zabbix,你不想彻底用Prometheus替换Zabbix(毕竟要花巨大的人力物力),那就可以考虑用Prometheus做容器云平台的监控采集,把数据集成到Zabbix里去,这样两套工具就结合起来了。

@powertiandi李宁(中国)体育用品有限公司系统架构师:

因为不涉及硬件的监控,OS+容器Prometheus作为趋势和整体方案更为合理些。目前Zabbix监控k8s成熟度还有待提高。

@hufeng719某钢铁企业系统工程师:

看作者主要关心什么指标。正如大家所说Zabbix偏物理主机、网络、磁盘、资源、进程、服务等综合性较好。Prometheus主要偏向于容器、pod监控。各有各的优点。个人感觉Zabbix简单一些,Prometheus+grafana+alertmanager一直是我的梦想,至今都没完整的搭建出来。尤其是alertmanager配置个性化设置较为复杂。具体效果还不太了解。上面jiaoyutwt的老师说Zabbix也支持监控k8s,不知道监控到什么粒度?有没有模板?能否与大家一起分享下?

@jiaoyutwt:zabbix6.0官方已经提供了模板

@chinesezzqiang?信息技术经理:

Zabbix虽然是一个开源产品,但是其本身对容器的监控说实话没有Prometheus好,比较适合主机、网络、存储等常规的环境监控。

@pysx0503?系统工程师:

按现在主流的方式来说,好像Prometheus对容器的监控更好一些。

按我的理解应该会用Zabbix监控网络和主机性能,Prometheus来主要针对容器监控,形成一个互补的监控方案。

-

文档评论(0)

183****9213 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档