Linx SSI集群检查点子系统的分析.docx

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Linx SSI集群检查点子系统的分析

哈尔滨工程大学硕士学位论文萱宣ii昌I 哈尔滨工程大学硕士学位论文 萱宣ii昌I i;宣;宣j篁;三置宣暑昌昌宣皇暑;iiiii暑皇i昌暑i;;;ii罱暑宣暑萱 摘 要 在军事领域、商业领域和自然科学研究等领域中,需要计算机具有很高的可靠性。 提高计算机的可靠性对计算机计算结果的正确性、连续运行的稳定性有着重要的意义。 目前在高可用计算机的应用领域中,使用集群技术构建的单一系统映像集群逐渐占据主 流地位。单一系统映像集群采用透明的方式对用户提供强大的容错能力和单一的系统视 图,使用户在获得系统提供的高可靠性的同时能够更方便的使用集群。 目前流行的高可用集群多数采用了在用户级实现的检查点容错技术,然而在用户级 实现的检查点容错软件对程序缺乏透明性且在功能上有较多限制;在操作系统内核级则 可以对应用程序实现透明的、进程粒度的检查点备份,并且由于在内核空间中可以方便 的获取所有和进程状态相关的数据,因此能够实现功能更完备、备份及恢复效率更高的 检查点构件。另外,目前存在的使用检查点容错技术的集群普遍简单的集成了开源组件, 并采用简单的全局检查点算法来实现集群的检查点子系统,缺乏针对集群应用背景环境 设计的高效的全局检查点算法。尽管在分布式环境下的全局检查点策略算法已经有不少 的研究成果,然而由于不同的算法有各自的局限性:或因系统的规模增大导致效率下降, 或因进程间消息数目增加导致性能降低,在集群检查点容错的实际应用中效果并不理想。 本文从整个集群软件体系结构宏观的角度对单一系统映像集群检查点子系统进行 构成和功能上的分析,在对单机检查点软件和全局检查点算法进行研究的基础上,提出 了基于Linux内核的增量检查点策略和一种针对集群应用环境的基于通信单元划分的检 查点算法。算法提出了静态和动态两种不同的划分策略,针对动态的划分策略采用启发 式的多层图划分的方法划分通信单元,并根据协同式检查点算法和基于日志消息的非协 同检查点算法的不同特点,将两者分别应用于通信单元内部和通信单元之间。基于通信 单元划分的检查点算法结合了协同式检查点算法和基于日志消息的非协同检查点算法 的优点,在进程规模增大和进程间消息数目增加时仍保持良好的可扩展性和较低的时空 开销。提出的基于Linux内核的增量检查点策略则能够进一步的降低检查点备份的空间 开销,能够很好的用于单一系统映像集群的检查点备份和卷回恢复的实现。本文的对比 仿真实验结果显示了基于通信单元划分的检查点算法具有更低的时间开销和更好的可 扩展性,适合于构建高效的集群检查点子系统。 关键词:单一系统映像;容错;检查点;通信单元;图划分 哈尔滨工程大学硕士学位论文Abstract 哈尔滨工程大学硕士学位论文 Abstract IIl the military,commercial and natural sciences areas,computer needs to have very high reliability.Improving the reliability of the computer is important to the correctness of computer calculations and the stability of continuous working of computers.In the field of lligh availability computers,the single system image cluster which is constructed using cluster technology gradually prevails.Single system image cluster provide a strong fault tolerance and single system view for users in a transparent way,which ensures the high reliability meanwhile enables users to access the cluster in a more convenient way. Most of the current prevailing higll availability cluster adopted user-level implemented checkpoint technology,however,this kind of implementation have the lack of transparency and have.many functional limitations.The system-level implemen

文档评论(0)

186****0507 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档