- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
郑州大学科技文章翻译
题 目: 并行架构与ARM指令集架构
指导教师: 李正民 职称: 副教授
学生姓名: 张黎明 学号: 20052430138
专 业: 计算机科学与技术
院(系): 信息工程学院
完成时间: 2009年5月20日
2009年 5月 20 日
并行架构与ARM指令集架构
在几代并行架构的推动支持下,ARM公司的新型芯片设计或许能改变人们获取技术的途径。随着销售量的快速增长,并且已经有超过15亿ARM处理器的出售,现在软件生产商们在可用ARM编码上拥有一个巨大的市场。
过去的15年间,ARM精简指令计算机处理器快速发展,提供了一系列的芯片,其中也包含技术成熟的多处理器芯片。对性能和附加关键新技术的效率的层次提升,这方面的嵌入式应用需求推动了ARM架构的发展。
在发展的道路上,ARM团队利用了称作计算机架构的全范围技术来开发平行架构。ARM采用的性能和效率方法包括多样的执行时间,子字平行架构,数字信号处理—比如操作、线程层并行、异常处理和多处理。
ARM架构的发展历程展示了过去处理器是如何应用不同类型的并行架构。新的ARM11MPCore多处理器更是顶峰之作。
针对嵌入式应用的RISC
早期的RISC设计,比如MIPS,纯粹集中在高性能上。架构师从而有了大量的寄存器集、更少的指令类别、一个存取架构和简单的管道。所有的这些在现代处理器上还是很常见。
ARM版本的RISC很多方面有不一样的地方,主要是因为ARM处理器是嵌入式的处理器,是装载在片上系统设备上的。尽管这样做保留了基于高性能的目标,但是研发人员仍旧把高代码密度、低功耗和小模具面积放在了优先地位。
为了实现这种设计,ARM团队改变了RISC规则,使得它包含对某些指令可变周期执行时间、一个用于处理输入寄存器的内嵌移位器、条件执行、压缩的16位Thumb指令集以及几条增强的DSP指令。
●可变周期执行时间
由于ARM是一个存取架构,所以ARM处理器首先必须在处理数据之前先装载到一个通用寄存器里。假使单周期执行限制了原来的RISC的设计,对每个寄存器单独的存取就没有效率。因此,ARM ISA指令专门用于存取多个寄存器。这些指令执行的周期不同,取决于处理器用来传送的寄存器的数目。这对于存储和恢复进程序言和结语的上下语境特别有用。这种方法直接改善了代码密度,减少了指令获取次数,降低了总功耗。
内嵌桶形移位器
为了使每条数据处理指令更加灵活,一个移位或者循环就能处理一个源寄存器。这使得每条数据处理指令更加灵活。
条件执行
一条ARM指令只有当它满足一定特殊条件时才会执行。这个条件放在指令块的末端,默认情况下,是无条件执行的。比如,生成12字节的存储空间—42%的用于除数计算,无论是否有条件执行。
16位Thumb指令集
这个压缩的16位ARM指令集以些许的性能消耗来执行较高密度的代码。由于Thumb 16位ISA被设计成编译目标,这不包括正交寄存器对ARM32位ISA的读取。采用Thumb ISA使程序面积大大减少。2003年,ARM宣布它的Thumb-2技术,对代码密度进行了进一步的扩展。这项技术在一个指令流里混合采用32位和16位指令来增加代码密度。为了达到这个目标,研究人员在处理器里融入了未对准地址。
增强的DSP指令
标准ISA中加入这些指令支持灵活快速的16*16乘法和算术饱和运算,这使得专门用于DSP的指令规则可移植到ARM机上。一个单一ARM处理器能执行应用程序,比如voice –over-IP,而不需请求一个专门的DSP。这个处理器能利用这些指令,例如SMLAxy来和一个32位寄存器的高16位或者低16位相乘。处理器能将R1寄存器的高16位和R2的低16位相乘后和R3相加并将结果放到R3里面。
图一显示了溢出是如何影响ADD指令的结果。
图1
饱和运算对数字信号处理特别重要,因为当整型数值溢出时,不饱和指令就会给出一个负值。一个饱和的QADD指令无需反复求值时即可返回最大值。
数据层并行架构
随着在V5TE ISA中引入增强DSP指令的成功,ARM在2001年引进ARMV6 ISA。除了改善数据层和线程层的并行架构外,还包含了其他的功能,比如,增强的数学运算操作、异常处理以及终端处理。
一个影响ARMv6 ISA设计的因素涉及逐渐增加的类似DSP功能的视频处理、2D和3D图像处理。在保持低功耗的前提下设计同时要实现这些改善的功能。ARM将单指令、多数据架构作为实现这种设计的方法。
在提供数据层并行架构方面SIMD是很常用的技术,它无损代码密度和功耗。一个SIMD的执行需要很少的指令
您可能关注的文档
- (冀教版)六年级数学下册课件 中位数及众数.ppt
- (硼与水补给系统).pdf
- (苏教版)六年级数学下册课件 中位数与众数.ppt
- (苏教版)六年级数学下册课件_认识众数与中位数.ppt
- (天津大 学 电气及自动化学院,天 津 300072) A New Network Improvement Algorithm in QoS Provid.pdf
- (中位数与众数).doc
- (专题一)求函数最值问题常用10种方法.ppt
- (转自仿真科技论坛)几乎所有有限元分析软件介绍——让你对CAE软件更了解.pdf
- )计算机图形生成基本单位是线段().pdf
- 0.18微米侧壁(Spacer)干法刻蚀工艺的开发及优化.pdf
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
最近下载
- 840Dsl-刀具管理简明调试.pdf VIP
- 2024年内蒙古建筑职业技术学院单招职业技能测试题库(b卷).docx VIP
- AAPD2014年初级未成熟牙髓治疗指南.pdf
- 《大头儿子和小头爸爸》导读.pptx VIP
- 2024年内蒙古建筑职业技术学院单招职业技能测试题库及答案(名校卷).docx VIP
- JJF 1471-2024 全球导航卫星系统(GNSS)信号模拟器校准规范.pdf
- 2.2《找一找》(课件) 2025北师大数学一年级下册.pptx
- 2024年内蒙古交通职业技术学院单招职业技能测试题库(名校卷).docx VIP
- 税务管理(第三版)梁俊娇课后习题答案.docx
- 2024年西安电力高等专科学校单招职业适应性测试题库及答案解析.pdf
文档评论(0)