- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
反汇编在常数因子优化中的应用四川省成都七中周以苏
然而在竞赛中,渐进时间复杂度是人们关注的重点,而同样能够决定程序运行快慢的常数因子优化问题却缺乏重视。在VisualC++语言环境下,从特定编译器生成的汇编代码出发,我探讨了反汇编在常数因子优化中的应用,并提出了若干优化改进方案。程序优化是无止境的,其中常数因子也是决定程序运行快慢的关键之一。绪引例:关于memset函数的小实验已知memset函数为O(N)复杂度的语句。你能直接答出Time值与运行速度的关系?观看右边的C++程序(假设计算机具有足够大的内存)
分析可能你认为Time值不影响程序时间复杂度,因此对程序的速度无影响。Time值与运行速度的关系但是,当上机实验后,你会发现,Time值较大或较小时运行速度会变慢,这是为什么呢?
分析Time值较大时,我们可以从反汇编角度解释程序运行速度变慢的原因。(如下)Time值较小时程序运行速度慢的原因,我们可以用Windows进行内存分配需要时间这个理论来解释。
分析Release模式下编译器对memset语句的处理如下Debug模式下编译器对memset语句的处理如下
分析
常数因子优化代码常数因子优化本质常数因子优化高级语言思路机器代码反汇编应用思想
时间常数归类数据分析
调用常数因子是指在函数调用过程中pushpop(有的编译器如VS.NET的cl用mov实现)和callret等汇编伪代码在调用过程中的耗费。虽然调用过程在Release模式下会被自动优化,但是在某些只提供Debug模式的竞赛环境中,我们该如何优化?所以本文主要阐述在Debug模式下的调用常数因子优化。一、关于调用常数因子的优化
1、Debug模式我们常使用inline关键字对代码进行优化,但是,inline关键字对编译器的作用是提示性质的而不是强制性质的。测试调用的函数原形:inlinevoidswap(inta,intb){intt=a;a=b;b=t;}测试代码:
1、Debug模式1、不使用子函数2、使用宏定义所以,在竞赛中应针对这个问题进行优化,这里本文提供了两种替代方案:
2、Release模式与Debug模式不同的是,在Release模式下,任何函数会被优先尝试作为inline函数,所以在代码中显式指定inline关键字仍然没有实际的作用。测试voidswap(inta,intb){intt=a;a=b;b=t;}尽管没有inline关键字,在反汇编中已经看不到对swap的调用了正因为这样,在Debug模式和Release模式下,stl库的运行效率才会有巨大的差别。
二、除法(求余)的优化(预备)预备知识:求余运算c=a%b等效于c=a-a/b*b但是,其内部实现直接使用除法的第二个返回值:
除法指令idiv是一种比例时间很大的指令。编译器的设计者也知道这一点。所以大多数情况下编译器都能将常数除法转化为快得多的位运算。(注:编译器同样也会把特定的乘法转化为位运算,比如乘以2等)除法(求余)的优化12
二、除法(求余)的优化比如,对于a/=2(a为32位整数)这句语句在Debug模式下的解释:这相对于执行idiv操作要快很多。但是,乘除法需要额外的特殊情况判断,如正负数、溢出等。这在代码中直接反映为冗余的汇编代码。所以,如果运算直接可用位运算代替,推荐使用位运算。但是,编译器的智能有很大的局限?,比如在变量除变量时,编译器根本无法判断变量的特殊性,以至于编译器直接将语句翻译为div(idiv)操作。这样,如果除数有着特殊性,潜在的性能优化就没有被用到。
二、除法(求余)的优化正确的方法是,判断出特殊性,使用手工的优化方式,如:优化后的代码: consta[]={1,2,4,8,16,32,64,128,256,512,1024,2048,4096}; c=b(a[i]-1); d=e(i-1);原始代码: consta[]={1,2,4,8,16,32,64,128,256,512,1024,2048,4096}; c=b%a[i]; d=e/a[i];
三、关于多维数组的性能优化由于计算机内存是线性的,多维数组的元素在排列为线性序列后存入存储器,如下所示:
由于在结构上需要进行转换,多维数组的引址操作被翻译成了乘法操作。数组定义:a[10][10]Debug模式下,对数组的取值操作使用了imul运算(Release模式编译时会进行和乘法运算相同的优化):三、关于多维数组的性能优化
三、关于多维数组的性能优化由于imul是一种比例时间较大的指令,如果能消去这一指令,便能够产生较大幅度的优化。如果操作的变址方法固定(比如像宽度优先搜
您可能关注的文档
- 特殊人群糖尿病患者防治与管理(课件).pptx
- 节目策划(认识创意对节目的重要性).pptx
- 牙体硬组织非龋性疾病.pptx
- 消费者心理分析与服务营销培训.pptx
- 职业经理人的综合管理技能.pptx
- 看图说话姊妹同读一本书.pptx
- 煤矿和瓦斯的监测与控制.pptx
- 经济学课件宏观经济政策.pptx
- 精选2015年最火爆的小本创业项目.pptx
- 英语倍数表达法.pptx
- 职业技术学院2024级工业机器人技术(安装与维护)专业人才培养方案.docx
- 职业技术学院2024级应用化工技术专业人才培养方案.pdf
- 职业技术学院2024级软件技术(前端开发)专业人才培养方案.pdf
- 职业技术学院2024软件技术专业人才培养方案.docx
- 职业技术学院2024级信息安全技术应用(安全运维)专业人才培养方案.docx
- 职业技术学院2024级新能源汽车检测与维修技术(车辆鉴定与评估)专业人才培养方案.pdf
- 职业技术学院2024级石油炼制技术专业人才培养方案.pdf
- 职业技术学院2024级环境监测技术专业人才培养方案.docx
- 职业技术学院2024级汽车制造与试验技术专业人才培养方案.pdf
- 职业技术学院2024级信息安全技术应用专业人才培养方案.pdf
文档评论(0)