- 1、本文档共85页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * 事件管理是一个很关键的流程,它为组织提供首先检测事件然后准确确定正确的支持资源以便尽快解决事件的能力。该流程还为管理层提供关于影响组织的事件的准确信息,以便他们能够确定必需的支持资源,并为支持资源的供给做好计划。 通过利用事件管理流程,组织能够确保他们的支持资源集中在最紧迫并且可能对业务产生最大影响的问题上。如果没有该流程提供的控制和管理信息,组织将无法确保他们在 IT 支持方面的投资(经常是很重大的投资)是否真正满足其目标。 * * * 消灭隐患-提升业务可用率和产品质量 通过解决潜在的问题和隐患,将业务故障消灭在发生前,促进BU的运维管理逐步从救火到预防发展和转变。 质量提升案例 没有模块间调用监控的时候(以前) 产品质量问题多,定位难,跟踪麻烦,长期得不到解决。上级主管常常一周询问运维主管好几次,本周的重大故障定位和解决情况如何,还有什么可能发生的情况存在。 有了模块间调用监控(现在) 上级主管一个月会询问运维主管一、两次关于重大故障定位和解决情况。 快速、准确的定位-提升运营效率 通过模块间调用的返回值及调用结果,使开发、运维人员定位故障的时间提升了35%。 以前平均定位时间:23分,数据来源于ISD突发事件管理系统 现在平均定位时间14.95分,数据来源于模块间调用监控系统邮件订阅点评功能 效率提升案例 业务:会员 功能:会员头像 问题:会员头像显示速度慢,不稳定,用户体验感很差 没有模块间调用前: 根据经验定位,估计是即通的接口返回速度慢。 与即通沟通后,答复接口没有问题。 问题只得搁置一直得不到解决。 接入模块间调用后 通过调用数据分析发现,即通的接口返回速度快,没有任何问题 网盘接口的调用返回速度慢,失败率高 通过排查发现:网盘提供的接口业务逻辑不稳定,有过多的冗余日志操作 优化相关代码,问题得到解决 从发现问题到具体定位:3个工作日 为业务发展和决策提供数据支持 提供成功率、响应时间等7个维度业务分析数据,为业务的扩容、迁移等决策提供了数据支持。 以QQ会员自定义图像为例,扩容前QQ会员自定义图像调用网络硬盘qqdisk上传接口成功率为81.51%、响应时间为3.52秒,通过数据分析,扩容后QQ会员自定义图像调用网络硬盘qqdisk上传接口成功率为99.9%、响应时间为197.79毫秒,CGI自动化测试时间由2.4秒下降到现在的800毫秒,大大提高了产品质量,提升了产品的用户体验感。 对不达标CGI业务潜在隐患的实时跟踪 ★通过模块间邮件订阅和日分析报告,对任何一个不达标的cgi业务模块的潜在隐患,从根本层面形成了BU在每天的业务故障跟踪方面的制度,这一方面在监控技术的发展和思路方面是一个大的进步 后续建设计划 结合配置管理,真实的勾画业务的内部调用结构图,使业务内部结构透明化。 后续建设计划 结合自动化测试系统,进行数据的深度分析,打通外部调用和内部调用之间的联系,精确监控每次外部请求的逻辑走向,形成业务调用逻辑有序图 ,使定位更加快速、直观 突发事件管理 服务支持流程 事件管理流程用于记录 跟踪和监控事件 事件管理目标 最快恢复正常服务; 尽量减少对业务的不利影响; 确保最可能的服务级别的质量,维护SLA条款的有效性; 反应公司平均故障解决时长、计算各个业务的可用率 单据类型 被动 主动 事件 维护单 客服 自动监控/ 运维发现 突发事件 监控单 投诉单 服务请求 (管工事件) 有影响 无影响 管工 BU 处理 部门? 标红色是为目前未实现 变更实施解决故障 产品关联图 事件管理 问题管理 变更管理 配置管理 服务台 变更请求 提供配置信息 配置变化通知 提供配置信息 提供配置信息 趋势分析 避免故障重复出现 监控告警 客服工单 投诉单 事件系统的价值和定位 SLA确定及签署 事件的记录及处理 SLA的阶段核算及监控 绩效及评价考核 SLA优化及改进措施 年度系统建设及优化规划 系统建设及优化实施 SLA偏离整改及行动方案 系统改进及优化 系统建设项目评估评价 图:可用性管理与项目建设的推进协作 解决方案及成果 解决方案 项目收益 事件记录 公司统一事件录入平台,记录跟踪事件处理直至最终解决 1.将原来分散在工单系统、事件系统和BU内部的运维数据录入统一的事件管理平台中 2.公司只建设一套系统,各部门不用投入重复开发 3.将ISD/IED对事件管理的管理和规范推广到其他部门 管理支持 建立服务目录和级别管理模块 1.在统一平台上展现管工SLA以及BU可用性统计等重要运营数据和报表,可以纵向对比运营质量 2.支持管工、客服、BU针对数据分析,进行管理决策 3.支持对运
文档评论(0)