- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运维部岗位职责
在软件产品的整个生命周期中运维部都需要适时地参与并发挥不
同得作用,因此运维部工作内容和方向非常多。 目标是在服务出现异常时尽可能快速的恢复服务, 从而保障服务的可用性; 同时深入分析故障产生的原因, 推动并修复服务存在的问题, 同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。 运维部最基本的职责都是负责服务的稳定性,确保服务可以 7*24H 不间断地为用户提供服务。负责维护并确保整个服务的高可用性, 同时不断优化系统架构、提升部署效率、优化资源利用率提高整体的 ROI.
一, 部门人员架构
运维总监:梁孟麟
运维副总监:汪国庆
二, 职责
1, 质量:保障并不断提升服务的可用性,确保用户数据安全,提
升用户体验。
2, 效率:用自动化的工具 /平台提升软件在研发生命周期中的工
程效率。
3, 成本:通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本。
从产品的 生命周期 来看:
产品发布前:负责参与并审核架构设计的合理性和可运维性,以确保在产品发布之后能高效稳定的运行。
产品发布阶段:负责用自动化的技术或者平台确保产品可以高效的发布上线,之后可以快速稳定迭代。
产品运行维护阶段:负责保障产品 7*24H 稳定运行,在此期间对出现的各种问题可以快速定位并解决; 在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。
三, 工作内容
1,问题发现:设计并开发高效的监控平台和告警平台,使用机器学
习、大数据分析等方法对系统中的大量监控数据进行汇总分析, 以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
2,问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速 /自动决策并触发相关止损预案,快速恢复服务。
3,问题跟踪:通过分析问题发生时系统的各种表现 (日志、变更、监
控)确定问题发生的根本原因,制定并开发预案工具。
4,变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的
变更工作
5,配置管理:通过配置管理平台 (自研、开源 )管理服务涉及到的多
个模块、多个版本的关系以及配置的准确性。
6,发布管理:通过构建自动化的平台确保每一次版本变更可以安全
可控地发布到生产环境。
7,容量管理:在服务运行维护阶段,为了确保服务架构部署的合理
性同时掌握服务整体的冗余, 需要不断评估系统的承载能力, 并不断优化之。在这方面主要工作内容有:
8,容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐; 通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。
9,容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、 优化服务部署架构等方法来高效的提升系统容量。
10,架构优化:为了支持产品的不断迭代, 需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下, 同时保
持高可用性。
文档评论(0)