- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
业务性能管理监控方案.
金融行业业务性能管理监控方案以奕信息2015/03/091.IT运维现状近年来,各金融企业的IT系统发展朝着集约化、高效化的方向发展,伴随着各种复杂的应用对IT系统的支持要求越来越高,IT系统规模越来越大,架构也越来越复杂,IT系统的后期维护管理显的越来越重要。传统的IT维护管理方式已经无法满足现有IT系统与信息化建设的迫切需要,同时在管理大量分布在不同地理位置的IT设备,也会大大增加故障的发现与响应时间以及运维成本。那么如何通过引入新的运维思路、方法并在保证IT系统与应用稳定高效运行的前提下,减少运维支出,提升服务质量是急待解决的问题。传统的运维方法造成了各运维部门之间的运维管理是割裂的,出现业务故障时,应用管理人员只能通过服务器性能状态收集,大量的交易日志来排查问题,但无法定位非服务器外的问题。网络管理人员通过应用管理的人员的交易故障描述排查网络问题,通过自身的网管平台进行配置梳理,网络设备日志查看、网络延迟测试、端口流量带宽跟踪等手段来定位网络故障,实际上很难定位问题,在遇上棘手问题时,网管人员都会使用网络嗅探技术来抓取交易的网络原始数据包进行分析,但其难度更大,首先要求网管人员对TCP/IP协议组的技术理解要高,要有日积月累的抓包分析经验,第二对业务交互的特点要了解,如果遇上一些特殊机制的应用,如长连接、多通道交互的应用或者多通道异步应用,通过大量数据包的查看,定位问题的效率很低,而且往往有时也不能精准定位。要求网管人员对生产业务系统都要有很好的理解,也不太现实。所以如何将网管人员和应用管理人员的运维工作通过一套监控系统来联系起来,简化生产运维工作,提高服务质量管理,避免部门间互相推诿责任的现象,是我们企业面临的真正挑战。2.方案思路为适应各金融企业大规模集约化运营管理的需求,解决IT运维中专业事件处理量大、业务影响分析困难、故障根源定位慢、故障节点难以自动隔离恢复等问题。为此,我们提出面向业务应用交易的运维监控系统的搭建,通过实时跟踪业务交易的四大性能指标(带宽、交易响应时间、交易请求量、交易响应量),多个业务纬度(业务子交易类型、交易请求码、交易返回码、客户交易区域码)来及时地掌握业务应用系统的运行情况。面向交易的应用监控系统有如下特点:面向服务的性能监控,深入服务组件同时关注业务性能与网络性能贯通面向服务的完整路径支持多中心监控,实时监测组件跨中心切换实时性高、符合面向服务架构的敏捷原则纯旁路监控,无需Agent,对服务和网络无影响实施简单,快速实现SOA治理中的性能管理目标3.方案架构Estop BPM基于网络数据包嗅探技术,通过先进的协议解码技术,充分利用可靠的网络数据源,在端到端的整个业务交易路径上通过Tap方式或端口镜像旁路的方式将网络流量引流到Estop flow sensor,Estop BPM后台监控系统实时提取各网络节点Sesor上的数据进行分析,呈现以业务为中心的各项性能监控指标,帮助企业IT部门建立自主可控的应用性能管理平台,从而实现应用可用性、性能、负载量的全面可视化。4.功能展示4.1 实时告警带宽超阀值告警最大响应时间超阀值告警业务响应成功率低告警告警功能处于任何监控系统的核心位置,告警系统的优劣直接导致了运维人员处理故障的效率,Estop BMP告警功能实时收集不同网络节点的三个纬度告警(带宽、业务最大响应时间、业务响应成功率),帮助运维人员通过业务交易的实时告警可知告警发生物理位置,告警内容,以及告警级别。4.2业务系统网络拓扑呈现通过交易应用的访问关系,梳理出交易的网络访问路径图,对理解业务流访问关系,故障定位有很大好处。4.3 实时监控业务四大性能指标4.3.1业务响应时间(最大|平均)实时展示跨越各网络节点的交易时延,并进行比对分析,充分反映网络交付时延、服务器处理时延、网络设备处理时延的变化。4.3.2 业务带宽统计监控业务实际所占网络带宽的变化,跟踪带宽负载,并为带宽扩容等需求提供依据。4.3.3 交易请求量,交易响应量实时统计每秒的交易请求数、交易的应答数,跟踪每秒交易请求响应的变化,查看每秒交易不成功的原因,如下图所示:此功能的最大价值:快速定位网络故障快速定位应用故障的能力适用于多种网络场景如:比对每秒防火墙前后、负载均衡器前后、通讯网关前后的交易请求、应答数目,快速定位网络设备故障、服务器无响应故障等。适用于多种业务场景如:监控TCP长连接,多通道应用交付,监控异步非对称路径的应用交付等。4.4实时业务统计实时统计业务各交易子类型、交易返回码、交易金额等多维度的统计。4.5历史数据统计分析对过去历史某一时间段的所有交易性能状态指标进行回溯分析4.6历史交易查询按照交易时间、交易子类型,返回代码等多种条件查询业务量 ,如下图所示:提供统计某时间段卡支付交易,返回代码为
文档评论(0)