ch5-第五章并行存储器系统讲解.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 并行存储器系统;5.1 存储器系统的层次结构;五个参数: 存取时间ti:从CPU到第i层存储器的往返时间 存储器容量Si:第i层的字节或字的数量 每字节成本Ci:第i层存储器的成本为CiSi 传输带宽bi:相邻层之间传送信息的速率 传输单位Xi:i和i+1层之间数据传送的粒度 对存储器系统中各层次存储器的特性,1993年的统计数据如下表:;存储器层次;第五章 并行存储器系统;5.2 包含性、一致性和局部性; 2. 相邻层之间的数据传送单位 CPU?高速缓存:字 高速缓存?主存储器:块(每块32个字节(8个字)) 主存?磁盘:页面(比如每页4K字节,包含128块) 磁盘?磁带:段 包含性可以用下面的图来说明:;CPU寄存器; 5.2.2 一致性(coherence) 1.一致性定义 同一个信息项与后继存储器层次的副本是一致的。 如果在高速缓存中的一个字被修改过,那么在所有更高层上该字的副本也必须立即或最后加以修改 。 ; 2.维护一致性的两种策略 (1)写直达(write-through,WT),即如果在Mi(i=1,2,…,n-1)中修改了一个字,则在Mi+1中需要立即修改。 (2)写回(write-back,WB),即如果在Mi+1 中的修改延迟到Mi中正在修改的字被替换时才进行。 ; 5.2.3 局部性(locality) Hennessy和Patterson(1990年)提出了一条90-10规则:典型程序在10%的代码上可能要耗费其执行时间的90%(例如嵌套循环操作的最内层循环)。 时间局部性(temporal locality):最近的访问项(指令或数据)很可能在不久的将来再次被访问。即对最近使用区域的集中访问。; 空间局部性(spatial locality):一个进程访问的各项的地址彼此很近,例如,表操作或数组操作含对地址空间中某一区域的集中访问。 顺序局部性(sequential locality):在典型程序中,除非转移指令产生不按次序的转移外,指令都是顺序执行的。 局部性原理指导我们去设计高速缓存、主存储器以及虚拟存储器组织。;第五章 并行存储器系统;5.3 存储器容量的规划; 5.3.1 命中率 在Mi中找到一个信息项时,称之为命中,反之称为缺失。 假定在层次结构中的存储器层次为Mi和Mi-1,其中i=1,2,…,n。在Mi??的命中率hi则是信息项可在Mi中找到的概率。它是表示两个相邻层Mi-1和Mi特性的函数。在Mi中的缺失率定义为1-hi。; 相继层的命中率是存储器容量、管理策略和程序行为的函数,它是独立的随机变量,其值在0到1之间。我们假设h0=0和hn=1,这意味着CPU总是先访问M1,并且访问到最外层Mn时总是命中的。 对Mi的访问频率为:; 通常情况下,有:; 5.3.2 有效存取时间 每当发生缺失时,就要付出代价去访问较高层次的存储器。这种缺失在Cache中称为块缺失。在主存储器中称为缺页错(page fault),因为块和页面是这些层次之间传送信息的单位。 缺页错付出的时间代价要比块缺失付出的更大:; 5.3.3 层次结构的优化 目标: 使Teff接近于M1的t1, 总成本接近于Mn的Cn。 优化过程可以表达为:对一个线性规划求最小值问题:; 例子:存储器层次结构设计; 解:; 层次化存储器系统必须解决的问题: (1)数据块在较高层存储器中存放在哪个位置?即块和页的定位问题。如果一个块存放在某一上层存储器中,怎样确定并找到该块,即块的寻址问题。 (2)不命中的将从下层存储器中访问,并将该块调入上层存储器中,但是如果上层存储器中已无空闲空间,则势必将上层存储器中的某一块调出,但应调出那一块,即替换问题。 (3)在写访问时,写入上层存储器中的数据必须在适当的时候写入下层存储器,何时写?;第五章 并行存储器系统;5.4 虚拟存储器技术; 5.4.1 共享存储和分布存储 MIMD系统可以分为两种: (1)tightly coupled shared-Memory multiprocessors (2)loosely coupled distributed-Memory multiprocessors 它们可以用图表示如下:;P1; 共享存储和分布存储的优缺点: 共享存储器: 易于编程,是单机的自然延伸; 程序员无数据划分的负担; 多进程并发的开销小,效率高,易于进程迁移,任务动态分配简单; 由于每个处理器都通过总线访问存储器,因而限制了处理器的个数,可扩展性差。; 分布存储器: 系统结构灵活

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档