北邮 信息安全专业 容错计算技术课件 第1章.ppt

北邮 信息安全专业 容错计算技术课件 第1章.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
容错计算原理 北京邮电大学 计算机科学与技术学院 姚文斌 绪论 容错和避错技术的产生和发展 容错计算的特征及定义 避错和容错技术的分类 容错和避错技术的产生和发展 评价信息系统的三大要素 性能、价格和可靠性 数字系统的可靠性 避错(Fault-avoidance):完美系统 元器件老化和筛选 生产工艺把关 容错(Fault-tolerance):容忍错误系统 多倍冗余与表决 自身纠错能力等 避错设计发展 起始于计算机问世之日 计算机发展经历电子管-晶体管-集成电路-大规模集成电路-超大规模集成电路,避错设计一直是提高计算机可靠性基本方法 元器件筛选-避错设计结构-避错系统 美国军用计算机公司包括:NORDEN公司、EMM公司、ROLM公司和MILTOPE公司 产品包括PDP-11M,VAX-11M等 我国从80年代开始研制抗恶劣环境计算机 容错设计-1 Von Neumann提出的五个容错理论报告是容错研究的基础 60年代,提出了三模冗余、N模冗余结构、纠错码理论、自检和自修计算机 70年代,研究范围从宇航领域扩大到交通管制、工厂自动化、银行、空港管理、潜艇导航等,成果有SIFT计算机、表决多处理机 80年代广泛应用,容错计算机普及深入到整个工业界,Stratus容错计算机系列、IBM System88,Tandem16等商业化。容错作为每个数字系统的一个重要特征的时代已经到来 容错设计-2 90年代,基于通用硬件的容错计算机得到重点发展。代表性是Stratus公司的FtServer系列计算机 受价格制约,专用容错计算机费用开销大 通用硬件开发时间短、软件支持丰富 学术界 IEEE(国际电机和电子工程学会)从1971年每年召开“国际容错计算年会FTCS”,2000年后改为可信计算会议DCS 展望-可靠性设计重要性 随着计算机技术进一步发展,可靠性设计必将越来越重要: 计算机性能提高使系统复杂性增加 计算机应用普及,使用者容易操作失误 计算机应用环境恶劣,如温度、湿度、电磁干扰、机械冲击和震动、盐雾 硬件成本日益降低,维护成本相对增高,需提高系统的可靠性以降低维护费用 发展方向-1 走与商用机兼容道路 研究避错技术发展抗恶劣计算机 瞄准主流商用机,集中力量在计算机结构组装、系统工艺、质量控制 研究商业硬件和软件构成高可靠容错计算机 传统容错计算机不足包括成本高(软/硬件专门设计)、扩展能力差、编程复杂、设计能力弱、设计周期长 美国NASA的JPL实验室研制航空航天通用容错计算机 欧洲GUARDS计划,共同研制通用容错计算机 发展方向-2 随着VLSI线路复杂性增高,故障埋藏深度增加,发现故障难度增大,为增加芯片可控性和可观测性的可曾实行研究已成为重要课题 随着整片集成WSI技术和Soc技术提出,硅片容错技术应运而生 将动态冗余技术用于VLSI设计,产生RVLSI技术。 用PLA进行容错设计是实现硅片容错 发展方向-3 容错系统结构从单机向分布式系统,由通用微处理器及微计算机来实现高性能分布式容错系统 分布式系统具有模块性、并行性和自治性三大特征 在局部网络中注入全局管理、并行操作、自治控制、冗余和错误处理,是研究高性能、高可靠性分布式容错系统 发展方向-4 软件可靠性技术 据统计,软件系统中软件故障占系统故障比例越来越高,甚至达到80%以上 软件可靠性两种方法 避错法:程序设计方法和软件验证技术 容错法:冗余信息与算法程序,及时发现程序设计错误 发展方向-5 容错性能评价 软件正确性证明 难以获得容错系统的可靠性数据 故障注入:通过对目标容错计算机系统注入各种软/硬件故障并观察目标系统对故障的响应,可以获得评价目标系统的各种参数,以辅助系统设计的改进 发展方向-6 理论研究方面,建立包含“故障”状态的计算机模型,并提出一套容错系统的综合方法论,建立一个广泛的故障病理学和相应的故障防护学 绪论 容错和避错技术的产生和发展 容错计算的特征及定义 避错和容错技术的分类 可靠性的四论域信息模型 逻辑的、信息的(内部的)、物理的、用户的(外部的)这样一个递增次序构造一个层次结构模型来描述一个信息处理系统 层次结构模型中每一层次都包含各自的一组基本概念、模型和术语,设计要求、性能度量、正确特性样式、测试方法和概念规范都可以通过给定的论域描述 系统的正常功能可由一个不希望时间UE(Unexpectant Even)(失效、故障、错误、失败而破坏)、不希望事件源于一个内部的论域 容错系统的属性和实现它的方法论就可以通过四论域、它们的不希望事件、不希望事件的检测算法和恢复算法来解释 容错计算就可以定义为当系统出现不希望事件时仍能正确地执行所规定的算法 不希望事件UE的分类 不希望事件在从逻辑域、信息域、物理域、用户域分别称为故障-错误-失效-失败

您可能关注的文档

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档