- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
技术故障
应急协同机制的探索
井亮亮
技术故障重要性及定义
技术故障的全生命周期
目录
如何落地应急协同机制
小结及展望
GOPS全球运维大会暨XOps技术创新峰会2024·北京站
01技术故障的重要性及定义
GOPS全球运维大会暨XOps技术创新峰会2024·北京站
技术故障重要性
海恩法则,也被称为Heinrich‘slaw,是由德国飞机墨菲定律是一种启发性原则,常被表述为:任何
涡轮机的发明者帕布斯·海恩提出的一个关于飞行安可能出错的事情最终都会出错。其含义是说,无
全的法则。这一法则强调,每一起严重事故的背后,论是因为存在一个错误的方法,或是存在发生某
必然有29次轻微事故和300起未遂先兆以及1000起事种错误的潜在可能性,只要重复进行某项行动,
故隐患。这表明,任何严重事故的发生都是经过了一错误在某个时刻就会发生。
个从苗头到隐患,再到事故的过程,而这个过程的每
一个环节都是可以预防的。海恩法则不仅适用于航空
领域,也广泛应用于企业的生产管理、安全管理、人
资管理等各个领域,其精髓在于“防微杜渐”,即通
过及时发现并消除事故的征兆和隐患,来避免重大事
故的发生。
可预防不可避免
GOPS全球运维大会暨XOps技术创新峰会2024·北京站
什么是故障?
风险?
故障?
问题?影响了业务的才是故障?
事故?
事件?
GOPS全球运维大会暨XOps技术创新峰会2024·北京站
技术故障在ITIL中的定义
故障问题
:problem
ITIL定义:“服务的意外中断或服务质量的降低”ITIL定义:为“问题”、“已知错误”,问题意味着隐患风险,已
知错误意味着主动整改。
问题(Problem)、故障(Incident)区分:
•故障对用户或业务流程有影响,必须解决这些故障,以便可以进行正常的业务活动
•问题是故障的原因。它们需要调查和分析,以查明原因,制定变通办法,并建议长期解决办法。这减少了未来故障的数量和影
您可能关注的文档
- 王国梁-必威体育精装版终稿脱敏-告别运维负担:腾讯云对 Prometheus Serverless 化的实践-腾讯-脱敏.pdf
- 赵舜东-终稿脱敏-基于开源工具的运维可观测性建设实践-赵班长.pdf
- 李威-脱敏-高效与安全并重:AI软件供应链管理策略与最佳实践 final @JFrog.pdf
- 张静-新版脱敏稿-让运维更智能:大模型时代下京东科技 AIOps 之路.pdf
- 谢荣良-终稿脱敏-工行 IT 架构资产与元数据管理体系建设揭秘.pdf
- 4,王晓翔-终稿脱敏-别让平台工程成为面子工程20240627 .pdf
- 韩洪雷-终稿脱敏DevOps工具平台的“诗和远方”.pdf
- 脱敏_顾铮-从 DevOps 到平台工程,让工具更好的为业务服务.pdf
- 隋吉智-终稿脱敏-大规模、多云主机统一可观测实践.pdf
- 吴晟 -终稿脱敏SkyWalking 原生数据库发布与云原生下复杂部署关系的识别 .pdf
文档评论(0)