网站大量收购独家精品文档,联系QQ:2885784924

软件的容错技术初探.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
软件的容错技术初探

目 录 ○、引 言 7 一、系统故障的表现形式及其错误的根源 7 ㈠ 故障、失效和错误的概念 7 ㈡ 故障的分类 8 ㈢ 错误的根源 8 二、软件容错技术 9 ㈠ 容错技术的内容 9 ㈡系统容错策略的分类 10 ㈢容错技术的实现 10 1.时间冗余 10 2.信息冗余 11 三、软件的一般容错设计举例 14 ㈠中断中的资源冲突及其预防 14 ㈡状态转移的条件审查 16 ㈢重要模块的安全措施 16 四、总结 16 致谢 17 参考文献 18 软件的容错技术初探 摘 要:在本文中,将着重讨论软件的容错技术。容错技术能容忍错误又不致使系统无法工作,也就是说是在软硬件错误已经发生的情况下使得系统仍能正常工作的技术。软件理论告诉我们,一个微机系统的软件是不可能没有错误的,更不要说没有不足之处了。软件的容错设计可以帮助人们尽可能减少错误,使系统由于软件问题而出错的概率降低到完全可以接受的程度,使系统在出错情况下仍可正常工作。另外,软件容错对硬件原因引起的错误解决也是有作用的大量的硬件容错技术应用往往和软件容错是相结合不可分的,比如数据备份没有硬件支持就不行随着现代工业技术的发展和计算机的普及,应用对计算机可靠性的要求愈来愈高。可以说,在任何时刻,人们都没有忘记计算机的可靠性问题现如今,容错对很多用户来说,早已不再陌生。建立在冗余技术基础之上的容错,在解决单点故障、缩短故障恢复时间、降低人为错误、减少部件和软件版本不兼容等方面相对于集群服务器都显示出了其强大的优势,并逐渐成为服务器市场的新亮点。系统故障的表现形式及其错误的根源研究容错技术的目的,在于。故障、失效和错误的概念人们常说的“出错”,严格地讲还不够准确。所谓“错”实际上是故障、失效和错误的概念的统称。对于研究容错技术来讲,需要把三者区分开来。 失效(failure)是指硬件物理特性异变。例如,集成电路内部硅片表面的龟裂、连线短路或断路、漏电、电路输出的电平由正常变到非正常值等。 故障(fault)是指硬件或软件的错误状态,是失效在逻辑上的等效,如一个电路的逻辑值由“1”状态错成“0”状态,软件判断的“是”错成“否”等,都被称为故障。一个故障可以用种类、值、影响范围和发生时间来描述。 错误(error)是指程序或数据结构中的故障表现形式,是故障和失效所造成的后果,如运算结果由正变成负,或是一个完整的值,都称为错误。若按逻辑性来分,故障可分为逻辑故障和非逻辑故障两种。造成逻辑值发生变化的故障称为逻辑故障,造成像时钟(clock)或电源出错等错误的故障称为非逻辑故障。 按时间划分,故障可分为以下三种: 永久性故障(permanent) 在英语文献中的“hard fault”常表示这类故障。永久故障是指永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异,如一个电路环了、线断了等。对软件来说,这类故障也是一个不可自动恢复的错误状态。 间歇性故障(intermittent) 这种故障是短暂的,但却是断续的,它既有其偶然性,又有其不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。 偶然性故障(transient) 这种故障在英语中有时用“soft fault”表示。故障的出现是暂时的,且可能是非重复性的。常常由于环境的变化、电源方面的干扰、元器件性能的波动、软件的随机变化、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。 针对不同故障可采取不同的容错方法。如对于永久性故障,可以调用诊断程序进行故障定位,然后采取纠错措施;对于间歇性故障,因其持续时间很短,因而无法使用诊断程序,但它又有重复性,又提供了一个进行错误断判的机会,可以通过更换硬件或软件等途径来达到修复的目的;要纠正由于环境等因素造成的偶然性故障,则是一件十分困难的事,这种故障一闪而过,连故障来自哪个方面都难以确定,但后果已经造成,只能靠改善环境条件等努力来减少这类故障。因此,如何消除间歇性故障和偶然性故障的影响,将是容错技术研究的重点课题。 ㈢ 错误的根源错误是失效和故障所引起的后果,可以归纳为图1所表示的关系。 图1 错误是失误和故障所引起的后果 容错技术的内容容错技术能达到对故障的“容忍”,但并非是“无视” 故障的存在。它首先能自动地适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的策略。 根据错误的不同情况,一个容错系统可能经历多达10个阶段: 故障限制 当故障出现时,希望限制其影响范围。故障限制是把故障效应的传播限制到一个区域内,从而防止污染其他区域。 故障检测 大多数失

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档