38.Linux 监控服务之nagios.pdf

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
38.Linux 监控服务之nagios

Nagios Nagios (nai ge si)原名为NetSaint,由Ethan Galstad 开发并维护至今。NAGIOS 是一个缩写 形式: Nagios Aint Gonna Insist On Sainthood Sainthood 翻译为圣徒,而Agios是saint的希 腊表示方法。 Nagios 是一款开源的免费网络监视工具,能有效监控Windows、Linux 和 Unix 的主机状态, 交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时 间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 Nagios 不但能够实现对系统CPU,磁盘、网络等方面参数的基本系统监测,而且还能够监测 包括SMTP,POP3,HTTP,NNTP 等各种基本的服务类型。另外通过一些插件的安装和监测 脚本自定义用户可以针对自己的应用程序实现监测,并针对大量的监测主机和多个对象部署 层次化的监测架构。而且在监测信息统计方面,Nagios 也能够和例如Cacti 等程序结合来提 供动态统计图表。除此之外 Nagios 拥有强大的日志管理系统,可以实现详细的日志记录以 及回卷。针对架构的扩展和服务器数量的增加可以方便地实现监测区域扩展。最难能可贵的 是 Nagios 提供了优秀的事件报警功能,能够将一些突发的事件以电子邮件的形式通知管理 员并能够针对出现的问题提供一些主动的解决建议和方案,并支持冗余监视。 一、Nagios 概述 1、简介 Nagios 是插件式的结构,它本身没有任何监控功能,所有的监控都是通过插件进行的,因此 其是高度模块化和富于弹性的。Nagios 监控的对象可分为两类:主机和服务。主机通常指 的是物理主机,如服务器、路由器、工作站和打印机等,这里的主机也可以是虚拟设备,如 xen 虚拟出的Linux 系统;而服务通常指某个特定的功能,如提供http 服务的httpd 进程等。 而为了管理上的方便,主机和服务还可以分别被规划为主机组和服务组等。 Nagios 不监控任何具体数值指标(如操作系统上的进程个数),它仅用四种抽象属性对被监控 对象的状态进行描述:OK、WARNING, CRITICAL 和UNKNOWN。于是,管理员只需要对某种 被监控对象的 WARNING 和 CRITICAL 状态的阈值进行关注和定义即可。Nagios 通过将 WARTING 和 CRTICAL 的阈值传递给插件,并由插件负责某具体对象的监控及结果分析,其 输出信息为状态信息(OK,WARNING,CRITICAL 或UNKOWN)以及一些附加的详细说明信息。 Nagios 可以识别4 种状态返回信息,即 0(OK)表示状态正常/绿色、1(WARNING)表示出现警 告/黄色、2(CRITICAL)表示出现非常严重的错误/红色、3(UNKNOWN)表示未知错误/深黄色。 Nagios 就是分析结果,返回4 中状态的某一种,并能实现报警机制,来给管理员发送报警通 知。 2、特性 由上述说明可以,Nagios 是极富弹性的,其监控功能完全可以按照管理员的期望进行。此外, 它外提供了对问题的自动响应能力和一个功能强大的通知系统。所有这些功能的实现是基于 一个结构明晰的对象定义系统和少数几个对象类型实现的。 1) 命令(Commands) “命令”用于定义Nagios 如何执行某特定的监控工作。它是基于某特定的Nagios 插件定义 出的一个抽象层,通常包含一组要执行的操作。 2)时段(Time periods) “时段”用于定义某“操作”可以执行或不能执行的日期和时间跨度,如工作日内的每天 8:00-18:00 等; 3)联系人和联系人组(Contacts and contact groups) “联系人”用于定义某监控事件的通知对象、要通知的信息以及这些接收通知者何时及如何 接收通知;一个或多个联系人可以定义为联系人组,而一个联系人也可以属于多个组; 4) 主机和主机组(host and host groups) “主机”通常指某物理主机,其包括此主机相关的通知信息的接收者(即联系人)、如何及何 时进行监控的定义。主机也可以分组,即主机组(host groups),一个主机可同时属于多个组; 5) 服务(Services) “服务”通常指某主机上可被监控的特定的功能或资源,其包括此服务相关的通知信息的接 收者、如何及何时进行监控等。服务也可以分组,即服务组(Service groups),一个服务可同 时属于多个服务组; 3、Na

文档评论(0)

mydoc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档