- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运维体系建设方案
一、 体系建设目标
查阅了大量资料,也没有找到对“运维体系”的明确定义,大多数资料对运维体系的解
读及建设方案都是基于 ITIL 认证体系与 Google SRE,通过一系列的制度、标准、规范及流
程,辅以高效的 IT 管理系统,向用户提供高质量的运维服务,保证系统的可靠运行。
基于对 ITIL 及 Google SRE的理解,部门的运维体系建设目标可以确定为: 以积极、负
责、严谨的工作态度,正确、高效、规范的工作方法,保证系统 7*24 小时正常服务,全心
全意为客户服务,让客户满意。
二、 运维现状分析
随着部门研发的产品日趋成熟, 系统的复杂度日益提升, 主要体现在业务功能增多、 业
务流程复杂、 业务组件多且依赖关系复杂、 系统硬件数量多等, 导致整个系统运维的工作量
及难度均大幅度增加。 运维做了很多的工作, 却依然保证不了系统的可靠服务能力, 并不能
完全满足来自公司内外部“客户”的运维服务要求。通过运维团队内部的讨论与分析,发现
运维工作提升困难的主要原因与其所处现状息息相关,主要存在如下亟待解决的痛点:
1) 运维人员的技能参差不齐,深度不够,专业化不足;
2) 运维人员分工及职责不明确,要求全栈运维,工作上出现相互推诿、拖延;
3) 运维操作随意性强,容易出现疏忽与失误,导致系统事故;
4) 运维服务接入点不单一,任何运维人员都可以接入服务;
5) 运维工作范围繁杂琐碎,出了问题就有责任,有失公平,影响团队成员的积极性;
6) 运维对问题的复盘分析不够深入,运维质量改进缓慢;
7) 大量的硬件资产缺乏全面细致的管理,不能做到全生命周期管理;
8) 大量的业务系统,全手工运维与巡检,耗时耗力;
9) 缺乏全面的系统监控手段 / 系统,不能及时发现系统中的问题;
10) 业务系统复杂度高,运维还没有完全了解业务系统的功能及依赖关系;
11) 业务系统质量低、可靠性差,导致升级变更的工作量超大。
以上并不是全部的问题, 这些问题均不是一天两天形成的, 有很多历史原因, 在此就不
再详述了。 但是如果不解决这些问题, 运维团队将会继续维持低下的工作效率, 运维工作质
量也得不到改善。为此,我们需要对症下药,借鉴他人的优秀实践,结合我们自己的实际情
况,建立科学、高效地运维体系,以解决所有上述的运维工作中的痛点,提升运维工作效率
及服务质量。
三、 体系建设规划
通过调研大量的资料,并根据运维现状、资源投入等实际情况,提出了“五化一库”的
体系建设规划,即“分工专业化、工作精细化、服务流程化、操作规范化、运维自动化、运
维知识库”,逐步提升运维工作的效率与质量。
3.1 分工专业化
目前,运维人员就像是 “全能骑士” ,即要懂业务,也要懂硬件、网络、安全、架构等
多方面的知识与技能, 人人都需要是全栈运维工程师。 的确存在这样
文档评论(0)