中小银行运维自动化经验分享.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中小银行运维自动化管理 解决之道分享 2014年7月 目录 * 运维管理中的操作控制难题 1 运维标准化自动化解决之道 2 作业任务精确控制 监控巡检准确定位 应急处置自动调度 ........................... 运维标准化自动化实施要点 3 运维管理总体目标-防范风险、优质服务、控制成本、系统建设 稳定运行 精确控制 资源管理 标准服务 应用整体监控 事件处置管理 知识维护使用 变更发布管理 运维服务标准化 运行成本可计量 技术规范体系化 运维架构规范化 制度体系层次化 运维管理 作业调度管理 安装规范核对 巡检全程控制 配置信息管控 设备资源管理 运行数据采集 资源性能分析 容量总体规划 数据资源管理 精确操控管理是运维管理的基础,也是科技服务质量的保障 作业管理难题-漏做错做、任务异常、执行风险、隐患排查 大型商业银行每日批作业任务数已达数千个,中小型商业银行也近几百个,随着业务复杂度及三方业务增加,任务数有增无减,并且变更频率教高,控制难度增加; 多个系统、多个作业任务之间形成了非常复杂的逻辑关系,仅靠表格等手工管理方式,很难降低任务执行差错率; 针对特殊日期的批作业任务临时变更,很难精确控制,一旦作业任务执行失误,影响范围较大,很难处理; 很难精确记录作业任务执行时长、时点、报错等情况,无法统计分析,发现作业任务执行过程中的潜在风险; ........................................................... 作业管理 作业管理手段-任务登记、变更控制、逻辑调度、过程记录、隐患排查 任务定义?关系管控?技术标准?过程监控?结果检查?故障联查?任务优化? 作业管理 运行监控难题-预警、发现、定位、排查、隐患、预估、采集、资产 监控巡检 关键业务交易出现问题,想排查故障原因,那么: 网络环境如何? 网络报文正常? 系统资源有瓶颈吗? 中间件有问题吗? 数据库有瓶颈? 应用程序有报错? 业务数据有问题吗? 客户请求端状态如何? 运行监控难题-预警、发现、定位、排查、隐患、预估、采集、资产 监控巡检 2013年3月17日 监控报警情况---缺乏网络通路质量检测直接报警【只有表象报警、无原因报警】 15:37 ECIF系统:三条报警ToFront 0307 error、ToFront 0307 error服务测试异常 15:38 收单系统:03801 Success rate is low! Pb751 BUSY! 15:40 电子支付系统:EPAY thread is busy 15:44 个贷风险管理系统:plms4和plms2、plms5、plms6阻塞线程数高、 15:44 信贷风险流程管理系统:weblogic线程数高、jdbc连接池等待 15:45 操作风险管理系统session锁等待 15:45 图前监控采集机10.1.7.15报错 15:46 验印系统ssl握手失败 分析:1、从15:37到15:46,10分钟内统一监控平台共有19条应用系统1级告警,但因总行网络环境监控手段的缺失,未能第一时间发现网络线路质量问题,因此,如何提早发现网络通路问题,如何快速定位故障点,是故障早发现快解决的关键。 2013年3月17日网络通路典型故障 应急难题-经验积累、工具标准化、逻辑关系控制、快速准确执行??? 应急处置 其它运维操作难题-数据全程管理、标准化变更发布、环境合规检查、资产动态采集验证 其它运维操作 中小银行运维标准化自动化的意义--人员、经验、风险、成本 实施运维操作自动化的关键目标是什么?:运维操作管理应该细分为如下几个领域,每个领域的具体目标是不同的:1)操作控制:准确调度;2)监控诊断:固化知识;3)应急处置:精确执行;4)变更发布:控制差错;5)规范检查:准确核对;6)资产采集:信息准确;7)数据管理:全程控制; 如何有重点分步骤的实施运维操作自动化?:根据细化后的运维操作流域及其管理目标,分别设计方案及标准,然后按照:首先标准化,其次自动化,最后制度化的路线进行实施; 运维操作自动化与哪些运维管理环节相关?:与一线建设、事件管理、应急处置、数据管理、运维标准化等运维管理环节密切相关,同时考虑人力配备、技术能力问题【短期引入】; 如何保持运维操作标准化的持续性?:通过问题日常跟踪机制【日积月累】、运维操作维护工作流程【查缺补漏】、相关人员岗位规划、以及工具持续优化【实用原则】达成; 意义及思考 目录 * 运维管理中的操作控制难题 1 运维标准化自动化解决之道 2 运维自动化领域的细分 标准化是自动化的前提 管理体系是有效实现的基础 ........................... 运维标准化自动化实施要点 3

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档