- 1、本文档共156页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机体系结构第10章资料
10.7 多处理机实例1:T1 T1的主要特性 特征 Sun T1 多处理器和 多线程支持 每芯片8个核,每核4个线程。细粒度线程调度。 8个核共享一个浮点运算部件。支持片内多处理器。 流水线结构 简单的按序6段流水线,load和分支的延迟为3个时钟周期。 一级Cache 16KB指令Cache,8KB数据Cache。64字节块大小。 在无竞争的情况下,L1不命中的开销是23个时钟周期。 二级Cache 4个独立的二级Cache,每个750KB且和存储体相连。64字节块大小。 在无竞争的情况下,L2不命中的开销是110个时钟周期。 初始版本 90nm工艺,最高时钟频率1.2GHz,电源功率79W, 300M个晶体管,圆片面积大小379mm2。 T1的性能 基准测试程序:TPC-C、SPECJBB、SPECWeb99 在以下不同情况下L2 Cache的不命中率 容量分别为:1.5MB、3MB和6MB 块大小分别:32B和64B 10.7 多处理机实例1:T1 在不同容量和块大小的情况下(与上图同),L2 Cache的不命中延迟 10.7 多处理机实例1:T1 T1的每线程CPI、每核CPI以及有效的IPC(每个时钟周期完成的指令数) 基准测试程序 每线程CPI 每核CPI 8个核的 有效CPI 8个核的 有效IPC TPC-C 7.2 1.8 0.225 4.4 SPECJBB 5.6 1.40 0.175 5.7 SPECWeb99 6.6 1.65 0.206 4.8 有效IPC=8÷每核CPI 10.7 多处理机实例1:T1 4种多核处理器的性能对比 特征 SUN T1 AMD Opteron Intel Pentium D IBM Power 5 核 8 2 2 2 每个核每时钟 周期发射的指令 1 3 3 4 多线程 Fine-grained No SMT SMT Cache 16/8 64/64 12k uops/16 64/32 一级 I/D in KB per core 3MB shared 1MB/core 1MB/core 二级: 1.9MB shared 二级 Per core/shared 三级:36MB 10.7 多处理机实例1:T1 特征 SUN T1 AMD Opteron Intel Pentium D IBM Power 5 三级(off-chip) 存储器带宽峰值 (DDR2 DRAMS) 34.4GB/s 8.6GB/s 4.3GB/s 17.2GB/s MIPS峰值 9600 7200 9600 7600 FLOPS 1200 4800(w.SSE) 6400(w.SSE) 7600 时钟频率(GHz) 1.2 2.4 3.2 1.9 晶体管数量(百万) 300 233 230 276 晶片面积(mm2) 379 199 206 389 电源功率(W) 79 110 130 125 10.7 多处理机实例1:T1 除了是重点开发ILP还是TLP的区别外,这些多核处理器还有一些根本的不同。 它们在对浮点运算提供的支持以及浮点运算的性能上有很大的不同。 它们的多处理器扩展能力不同,这对存储器的设计以及外部接口的使用有很大的影响。 Power5的可扩展性是最好的 所用的实现技术差别很大,难以对它们的晶片大小和功耗进行比较。 对存储器系统及其带宽的要求不同。 4种多核处理器的性能 以SPECRate、SPECJBB2005、SPECWeb05以及类TPC-C测试基准程序为负载 图中所有的数据都对Pentium D的数据进行了归一化处理,即Pentium D的值都是1。 Origin 2000系列可扩展服务器产品 该系列包括:Origin 200、Origin 2000 Deskside、Origin 2000 Rack和Cray Origin 2000 4种机器。 Origin 2000 Deskside桌面服务器系统支持的处理器数目最多为8个 Origin 2000 Rack机柜服务器系统支持的处理器数目最多为16个 Cray Origin 2000服务器系统具有大规模扩充能力,支持的处理器数目最多可达到128个。 10.8 多处理机实例2:Origin 2000 10.8 多处理机实例2:Origin 2000 Origin 2000系列服务器产品优点 不仅具有SMP的易编程和平稳扩充特性,而且还具有MPP的高可扩放性,应用非常广泛。 该系列服务器综合平衡了高性能、可扩放性、可用性和兼容性,能满足许多应用的需求。 Origin 2000 服务器系列的I/O带宽可达102CB/s,系统传输速率比同类SMP服务器快几十倍。 (处理、存储和传输各种多
文档评论(0)