《超算中心运维管理方案-13C-13250129-王排.docxVIP

《超算中心运维管理方案-13C-13250129-王排.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《超算中心运维管理方案-13C-13250129-王排

超算中心运维管理方案学生姓名王排学 院软件学院专业班级软件工程13C学生学算中心运维需求及分析超算中心需求:依据服务指标运行情况,建立运维服务水平评价体系:服务运行指标体系覆盖系统连续性服务能力、系统设备可用性、人员服务能力、项目管理等方面,通过服务指标监控和运行分析,实现对运行服务的集中、分级管理和监控,并能够及时调整运行维护策略,促进运维质量和效率的提高。从整体运维、优化的角度,包括但不限于实现以下内容,并根据实际业务运行需求不断完善优化:项目管理:为保证项目顺利实施所需的项目整体规划、进度控制、相关方沟通,组织并协调驻场人员、分包商、供应商、设备厂商、承建商及维保商等等共同配合推进运维项目的顺利进行。设备管理:根据运维目标针对各软硬件系统、设施制定使用、维护、操作规范,形成有效的管理机制,分析各系统风险点和项目实施期间发现的问题并制定相应的解决和优化方案,并跟进日常各种问题、故障的处理实施情况,提高机房的可用性。机房容量管理:根据机房实际情况与业务发展需要,综合供配电、制冷、消防、承重、设备管理等等因素,制定机房的空间及设备上线管理规范,提高机房基础环境的利用率;生产安全管理:根据国家有关的法律法规及行业规范,从生产运行、人身安全、资产、信息等角度制定安全管理制度,并切实执行,实现运维期内安全零事故;服务质量管理:根据实际运维工作需要,制定服务质量标准及质量控制规程,通过培训、演练等多种方式实现对项目实施质量的控制,保证各项要求、规范的实施效果。资产管理:针对本项目范围内所涉及的设施、设备、耗材、工具、软件等等制定严格的管理规范,并落实相关管理岗位责任,保证项目各项资产的完整性。人员管理:根据岗位需要和项目要求,配备具体相关技能、资格证书及资历的服务人员,并制定完善的人员管理与考核制度,保证服务人员的精神面貌、服务水平。配置及数据管理:针对本项目实施所涉及和产生的包括系统资料、规章制度、系统运行要求、运行数据、实施记录等所有与项目有关的信息数据应该进行及时的整理、保存,并根据其关联性形成目录便于查询。超算中心需求分析:超算中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。超算中心中心运维对象共可分成5类:1,机房环境基础设施部分。这里主要指为保障数据中心所管理设备正常运行所必需的网络通信、电力资源、环境资源等。这部分设备对于用户来说几乎是透明的,因为大多数用户基本并不会关注到数据中心的风火水电。但是,这类设备如发生意外,对依托于该基础设施的应用来说,却是致命的。2,在提供IT服务过程中所应用的各种设备,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体。3,系统与数据,包括操作系统、数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样看得见,摸得着,但却是IT服务的逻辑载体。4,管理工具,包括了基础设施监控软件、监控软件。这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证到数据中心如何管理好与其直接相关的资源,从而间接地提升的可用性与可靠性。5,人 员,包括了数据中心的技术人员、运维人员、管理人员以及提供服务的厂商人员。人员一方面作为管理的主体负责管理数据中心运维对象,另一方面也作为管理的对 象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。超算中心运维存在的问题/难点 1、超算中心项目庞大,从设备到人员,相对复杂,统一协调是大问题,导致问题不能及时解决。各部门之间无法形成统一协调的IT系统管理,问题得不到有效的跟踪,也就谈不上及时解决。  2、原因不清,导致问题无法根治。如果说统一协调管理问题不得不解决,那么当超算中心的某个流程出现问题时,往往因为找不到故障原因,而无法从根本解决问题的情况,却成为中心很难解决的问题。  3、对人的依赖,导致人员变更后的运维问题。如果一个熟练运维人员的岗位发生变更,当问题在出现时,就很难得到迅速处理。即使会有新人继承前人的工作,但他却无法继承前人的运维经验,这成为企业运维成本增加,重复投资的重要原因。4、技术问题,超算技术,机房的维护,需要非常专业的技术,这样对人员的依赖,特别对高技术人才需要是必须的。三,超算中心运维解决方案人员配置:人员配置原则是双岗制,重要岗位配置双人轮换,以保证人员的更替不会对现有运维管理造成影响,包括不少于以下数量的人员:1.驻场项目经理1名(5×8驻场,7×24小时待命);2.机

文档评论(0)

1983xuesheng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档