田逸︰互联网监控的艺术.pptVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
田逸︰互联网监控的艺术

互联网监控的艺术 演讲人:田逸(sery@163.com) 监控演变历程 用户、老板电话通知 Ping主机 放在线收音机 时不时登陆系统查看状态 使用监控平台 必要性 被动方式延误时机,并且给技术人员产生巨大的压力 Ping主机对于服务器数量多的场合会怎么样? 服务器在远端,无声卡等,放不了在线收音机音频 数以百计甚至上千计的服务器,挨个登录恐怕是个困难 部署监控平台,随时了解大规模网络运行的状态,并且在出现意外时及时报警 高可用性的保证措施 高可用架构:应用集群、负载均衡、分布式文件系统、数据库集群等 设计良好的监控系统 选择何种监控方式 自己写程序或者脚本小工具 商业解决方案 开源的方案 自己写程序或者脚本 优点 1、现金成本低 2、操控性强 不足 1、集中管理是个问题 2、无可视性效果 3、调度需要好的技巧 4、运营复杂,如监控一个集群,需要对集群维护。因程序被安装在每个主机,因此可能要重复n次操作 商业解决方案 优势 1、大包大揽 2、用户不用承担运营中的责任。假如出了问题,可把责任推给厂商。 3、很受欢迎的展现方式,如报表、美观的用户界面 不足 1、成本高(一般以万计) 2、取舍不易:需要的功能可能不足,不需要的功能一大堆 商业解决方案(续) 3、巨大的资源占用:就client代理而言,包大小基本以百兆字节计 4、扩展性差。要新增模块,需要昂贵的支出 5、安全问题。来自代理agent的权限。 开源解决方案 优势 1、开源免费 2、定制能力强 3、完全可控 4、集中化管理 5、可视性好 不足 1、需要很强的技术实力 2、一切靠自己 推荐的方案 开源的方案 Nagios、zenoss、Ganglia 、zabbix 等 本案以nagios为例 谁在使用nagios Facebook 搜狗 网易 空中网 新浪 阿里巴巴 互动百科 Sohu 其他更多……. 什么是nagios Nagios是一个框架,核心部分是调度器和状态通知模块。 调度器调度插件或者任意定制的可执行程序,根据执行结果返回状态值,并根据需要进行相信的报警/通知 Nagios监控机制 检查登录用户数的场景 条件: 1、当登录数小于5时,属于正常 2、当用户数大于5小于8时,应当警告 3、大于8时为异常 脚本:logins.sh 检查用户登录脚本(续一) #!/bin/sh logins=`who |wc -l` if [ $logins -le $1 ] then echo OK!-login count is $logins exit 0 fi if [ $logins -gt $1 -a $logins -le $2 ] then echo Warnning!-login count is $logins exit 1 fi if [ $logins -gt $2 ] then echo Critical!-login count is $logins exit 2 fi 检查用户登录脚本(续二) 手动执行脚本,形如./usercon.sh 5 8 输出: 1、有2个用户登录时:OK!-login count is 2 2、有6个用户登录时:Warnning!-login count is 6 3、有9个用户登录时:Critical!-login count is 9 调度脚本 本地调度:用于检查远程服务端口等 远程调度(Nrpe):检查主机资源、检查内部网络服务 设定调度时间间隔、重试次数等。注意与crond不同。 通知机制 退出代码为0,代表正常 退出代码为1,代表警告warning 退出代码为2,代表极度异常Critical 退出代码为3、代表未知(不常用) 监控的表现形式 Web方式:不同的用户查看各自负责的应用运行状态 邮件:故障发生或恢复时发送邮件告警 手机短消息:最及时的通知方式 Nagios的组成 3个大的部分: 1、守护进程(core) 2、插件 3、web接口 定制安装nagios-core Useradd nagios –s /sbin/nologin Tar zxvf nagios-3.x.tar.gz Cd nagios-3.x ./configure –prefix=/usr/local/nagios Make all Make install make install-config install-commandmode 为保持通用性 舍弃了一些安装选项 安装插件 Tar zxvf nagios-plugin-x.tar.gz Cd nagios-plugin-x ./configure –prefix=/usr/local/nagios Make al

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档