- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Yao J, Miwa S, Shimada H et al. A fine-grained runtime power/performance
optimization method for processors with adaptive pipeline depth. JOURNAL OF
COMPUTER SCIENCE AND TECHNOLOGY 26(2): 292-301 Mar. 2011. DOI
10.1007/s11390-011-1132-9
基于可调整段数流水线处理器的一种细粒度动态功耗性能比优化方案
动态调整输入电压 (Dynamic Voltage Scaling, DVS )方法通过降低处理器
在低工作负荷状态下的电压来减少耗电量,并在负载上升时恢复电压。这种调整
引入数十到数百微秒的处理停顿,不利于超细粒度(微妙级别)的节能控制。基
于段数可调整流水线(Adaptive Depth Pipeline, ADP)的处理器节能方法通过设
置专用的逻辑信号来停止部分处理器流水线的段间寄存器的使用来达到节能目
的。这种方法与流水线的单次清空延迟相当,只有数十纳秒,能用来进行超细粒
度的节能控制。
基于段数可调整方案,本论文主要提出了一种超细粒度的功耗性能比优化方
案。论文建立处理器的动态功耗比模型,构筑了一个从处理器当前的性能参数(单
位时间执行的指令数)到功耗性能比最优的流水线段数的映射。通过超细粒度的
动态观测方法预测处理中的程序未来可能的工作负荷。而后,微处理器根据负载
来调整自身的流水线到最优段数,优化功耗性能比。由于综合了多个性能参数,
避免了非常短促的剧烈变化引起的过度频繁的再配置。该方法能够检测到程序执
行过程中的微小变化,将处理器调整到满足负荷的最低处理能力,从而提高性能
功耗比。
本文采用模拟工具 SimpleScalar 和 Wattch 功耗工具包,主要参数如下:
处 理 8 路流水线,乱序执行;
器 RUU 单元:128,LSQ 单元:64;
整数 ALU 单元:8,乘除单元:4;
浮点数 ALU 单元:8,乘除单元:4;
存储模块端口:8。
本文评价使用 SPEC CPU2000 的整数、浮点数共 17 个评价程序。整数应用
采用优化方法后,功耗性能比降低为原来的 86.5%。浮点数应用能降低 5.1%的处
理器的功耗性能比。这两个数据都非常接近于基于先验知识的理想化控制所能获
Yao J, Miwa S, Shimada H et al. A fine-grained runtime power/performance
optimization method for processors with adaptive pipeline depth. JOURNAL OF
COMPUTER SCIENCE AND TECHNOLOGY 26(2): 292-301 Mar. 2011. DOI
10.1007/s11390-011-1132-9
得的最大功耗性能比的降低。
本文也进行了硬件实现,与相关论文所提出的基于程序执行中的指令空间局
部性标识来优化处理器功耗性能比的方法(Signature History Table, SHT 方法)
相比,能有效的降低额外硬件的需求。在相同的功耗性能比的提高的前提下,本
文所提出方法使用的额外硬件资源为 SHT 方法的 14.1%,并将控制算法的计算时
间由 50 时钟周期(Clock Cycle)减小到 1 时钟周期。
本论文主要有以下贡献:
1. 建立了处理器的功耗性能比的模型,考察了能较精确反映处理器功耗性能
比的工作采样参数。
2. 提出了一种超细粒度的执行程序的特性分析方法,并对需要的额外硬件进
行了合理的优化。能够利用较小的硬件资源来较精确的预测执行程序在下一个工
作时间段的特性,即最大负载要求。
3. 基于 1 和 2,实现了细粒度的处理器功耗优化,从而能够最大限度的利用
可调整流水线的快速再配置的特性。
您可能关注的文档
- 实验小组准备探究某种元件Q的伏安特性曲线,他.doc
- (微生物结冷胶的研究进展.doc
- (以下称自动控制系统)在乳品中的应用及工艺改进分析.ppt
- 嘉 PBTT程塑料腐蚀模具型腔问题浅析.pdf
- “空气与环境”教学中的研究性学习结题报告.doc
- 《52生态工程的基本原理》.doc
- 《8090后员工的管理与激励》.doc
- 《;1畜禽种类及品种试述猪、牛、羊、兔及主要禽类的经济类型.pdf
- 《几何光学的基本原理》练习题.doc
- 某人在某个市场某个商家买了某台电脑,请用你熟悉的计算.doc
- 大题突破技法⑰以情境化+和材料化解答非选择题+课件--2025届高三统编版(2019)历史二轮专题复习.pptx
- 一线历史教师的命题日常——高三模拟题命制+课件+--2025届高三统编版历史二轮复习.pptx
- 2024-2025学年高三二轮耕地资源与国家粮食安全.pptx
- 2025届高考热点作文素材4:体育人物.docx
- 专题一+中国传统官方记史和修史+课件--2025届高三历史统编版二轮复习.pptx
- 2025届高考写作指导:巧用排比句.pptx
- 2025届高考地理一轮复习微点精讲课件——世界洋流分布规律.pptx
- 2025届一轮复习课件:第五章++地表形态的塑造++第13讲++塑造地表形态的力量pptx (1).pptx
- 2025年高考热点素材:饺子导演与《哪吒》.docx
- 每日一题32期+新职业“陪诊师”-2025年高考语文大市模拟每日一题一素材.pptx
最近下载
- 2024年湖南汽车工程职业学院单招职业技能测试题库及答案(历年真题).docx VIP
- 泌尿外科常见术后护理.ppt
- 泥塑教学课件.ppt
- AQ 1083-2011 煤矿建设安全规范(高清-安全-行业标准).pdf
- 石油 - NB-T 10009-2014 煤层气井排采技术规范.pdf VIP
- mes系统简介演示.pptx VIP
- Unit 3 Mary's diary(教学设计)-2023-2024学年Join in外研剑桥英语六年级下册.docx
- 2025年湖南铁道职业技术学院单招职业适应性测试题库审定版.docx VIP
- 江苏省公安机关人民警察基本级执法资格等级考试试卷(含答案).pdf VIP
- 北京大学教师行为规范.pdf
文档评论(0)