- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
13 -
XXX政府可行性研究报告
XXX公司
2014年X月X日
项目建设必要性分析(目前运维管理的问题和挑战)
日常维护及故障恢复
目前大多数业务主机的管理采用基于带内方式的网管软件或其他远程图形终端方式,一旦业务主机操作系统或数据链路本身的网络连接发生故障,则只能派人去现场解决或者要求现场维护人员为其重启服务器,过长时间的修复过程将严重威胁到生产系统服务的安全性和可靠性,这种管理方式无法满足XXXX对于生产系统的运维服务等级。
设备电源监控及环境监控
XXXX目前无法对的业务主机设备及网络节点设备进行有效的电源检测与控制,无法精确检测被控设备的电流、电压、功率等运行参数,无法精确检测设备运行环境的温、湿度。
目前机柜内为服务器等设备配电采用的是普通民用插线板,而且大部分插座的类型为国标万用型,没有用电负载的测量;机柜负载通过外接电流表的方式实现,没有负载数据输出和告警功能,因此在用电的安全性和可靠性方面无法得到保证,从而造成了数据中心用电的潜在故障隐患,具体的用电故障隐患有:
数据中心规模庞大,部署分散;
由于业务增长而引起的设备采购,机房扩容、导致机房用电增长过快,电不够用;
机柜数量多,设备负载跨度大,配电复杂,须要一套灵活的配电系统。
想要改进机房设备的用电效率却无从下手;
设备用电管理缺乏有效控制手段
由于无法得到服务器等设备的实时用电负载,当新加设备时容易造成过载挑闸,引起设备宕机,生产系统无法对外提供服务,导致应用部门投诉并降低满意度。
由于机柜插线板没有加电延时功能,多台设备同时加电会产生瞬间峰值电流(外接电流表也无法设置阀值告警)造成挑闸,引起设备宕机。
由于国标万用插座可以插入多种规格插头,插座缝隙相对较大有设备电源线脱落掉电的隐患,引起设备宕机。
人工对设备用电定期巡检,缺乏实时性及专业性。
目前管理方式是值班人员每XX小时巡检机房一次,手工为机房内的设备运行状态,机柜耗电,温湿度等参数建立档案,如遇某机柜电容量接近阈值,只能以人工方式示警;
机房各子系统随着扩容改造要求集中监控告警
为了保障良好的数据中心设备运行环境,有效预防设备停机、电源烧毁等严重故障,改善容量不足,低效高耗的电源利用状态,现急需建立一套精细化的机房管理控制系统。该系统可以快速、高效的通过远程操作达到对设备的电源控制;通过集中的用电状况监控和数据分析能够实现对数据中心安全、高效和精细化的管理。
安全统一管理(权限划分;系统维护日志。。。)
多种维护手段并行,无法做到运维人员权限统一上收及精确划分,造成设备维护管理混乱。如何将所有操作人员的操作权限进行分用户密码、分操作区域、分业务类型、分时间、分IP等等精确划分是真正实现权限管理的保障。
在传统的维护方式下,很难实现维护日志管理。多种操作手段并行,无法精确记录某时刻、某人、某设备的操作情况,导致所有运行操作处于无记录、无管制状态,不利于进行运维审计和事故审计。
数字化集中运维管理监控系统
集中远程集中运维监控系统采用ATEN公司的解决方案,方案分为远程带外管理和智能电源管理两个部分,主要组成如下:
远程带外管理的主要功能
用户认证授权
单人单帐号
严格的密码策略
详细的用户访问授权
基于用户组与IP地址绑定的访问控制列表
日常维护操作
对多平台、多系统实现跨平台访问
提供RDP、SSH等带内访问方式进行日常维护
系统性能等参数查看
紧急故障处理
系统升级操作
紧急故障诊断及排除
系统BIOS级别访问
操作记录审计
设定操作关键字
对操作关键字实现邮件告警
操作记录审计
生成操作报表,方便查看及统计
ATEN安全、智能电源管理系统
方案的组成
ATEN的电源管理解决方案有两部分组成:
智能PDU,它主要有三个大功能:
PDU插座级的用电状况测量及阀值告警
PDU插座级的远程开关(包括插座的来电延时功能,规定供电时间)
机柜级微环境监控(温度湿度)及阀值告警(结合传感器探头实现)
集中远程电源管理的主要特点
数据中心电力运行环境的统一监视,如基于数据中心级,部门级,机架级,设备级的电力状态监测等;
监控PDU插座一级的用电量(电流,有效功率…) ;
监控机柜的温度和湿度(每个智能PDU最多可同时采集8个温度和湿度数据);
对机柜内的服务器等设备进行远程的加电、断电、重启等电源管理;
设置阀值并通过SNMP和E-mail来接收告警;
高安全的电源管理:强密码;支持用户认证;
支持开发接口,可整合到统一的网管或OA系统;
集中远程电源管理的实际作用
运营维护
通过对设备用电状况的监控,并定义阀值告警,及时获取设备的运行状态信息,在故障发生之前进行预防;
可以在远程像亲临现场一样对设备进行电源开、关、重启等操作,及时修复故障,保障系统持续运行;
设备端供电的管理,将PDU空闲
文档评论(0)