- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《分布式系统》课程实验报告之一
《分布式系统》课程实验报告
实验1:Intel多核编译器及Vtune性能分析器
姓名 胡欣沅 院系 软件学院 学号 1083710311 任课教师 张伟哲 指导教师 张伟哲 实验地点 软件学院五楼机房 实验时间 2010-11-12 实验课表现 出勤、表现得分 实验报告
得分 实验总分 操作结果得分 一、实验目的 要求:需分析本次实验的基本目的,并综述你是如何实现这些目的的?
二、实验内容 该部分填写在实验过程中,你都完成了哪些工作。
1.1
1.配置Intel C++ Compiler(icl)编译器环境设置(Visual Studio* .NET* 环境);
2.使用MSVC*和Intel C++ Compiler编译器分别编译示例程序,并记录程序执行时间
3.使用高级优化参数(-O3)对程序进行优化编译,记录结果并予以分析
4.使用过程间优化参数(-Qipo)进行程序优化编译,记录结果并予以分析
5.使用配置向导优化(PGO)进行程序优化编译,记录结果并予以分析
6.使用矢量化优化参数(-Qxp)进行程序优化编译,记录结果并予以分析
7.使用多个优化参数(-O3、-Qxp、IPO和PGO)进行程序优化编译,记录结果并予以分析
1.2
1、关闭病毒扫描和监控程序;
2、运行Intel VTune Performance Analyzer,并新建工程项目;
3、启动Sampling,选择Windows*/Windows* CE/Linux Profile,;
4、选择gzip.exe程序的完整路径,并载入到VTune Sampling中采样(Sampling Wizard建立工程)并分析采样采用Call Graph方式对应用程序gzip.exe进行重新采样并找出关键路径,并找出开销时间最大的函数及函数调用过程,并对程序进行分析BLAS、二级BLAS、三级BLAS的性能特征和它们之间的差异。
二、蒙特卡罗法计算圆周率
三、实验结果 记录实验结果。
1.1
1. 配置Intel C++ Compiler(icl)编译器环境设置
2. time = 7.234000 seconds
3. time = 4.422000 seconds
4. time = 4.515000 seconds
5. time = 18.421000 seconds
6. time = 3.609000 seconds
7.time = 3.485000 seconds
1.2
①gzip.exe中哪个函数消耗了最多的时间?
②gzip.exe中哪个函数CPI最高?③gzip.exe源代码中哪一行时钟周期最多?④gzip.exe是多线程程序吗?
1.3
1.
roll_your_own: ___3.875________
DDOT: __3.781________
DGEMV: _____1.078______
DGEMM: _____0.079______
roll_your_own: ___3.843________
DDOT: __3.797________
DGEMV: _____1.062______
DGEMM: _____0.093______
2.蒙特卡罗法计算圆周率:
答:为什么不是1:1的直接替换rand()函数?rand()函数不符合MKL函数库的使用要求。
设置blocksize的目的是什么?限制随机数的范围
参数BRNG 和VSL_BRNG_MCG31的作用是什么?限制随机数的范围
对这个程序来说,它们是最好的选择吗?不是
能用多线程实现吗?能
四、思考题 思考题1:Intel C++ Compiler的基本特点?
答:
1. 与其他常用工具保持兼容,可以集成到广泛使用的开发环境,并且同其他广泛使用的编译器保持着特性源与二进制方面的兼容性
2.集成了 Microsoft Visual Studio 2005、Visual Studio .NET* 2002/2003 以及 Visual Studio 98
3.提供扩展 32 位和 64 位多核英特尔处理器支持
4.支持多语言标准,如ANSI/ISO 标准,OpenMP* 规范 2.5 版
思考题2:如何使用Intel C++ Compiler进行应用程序优化,基本步骤包括?
使用命令行nmake /f raytrace2.mak CF=XXX进行优化,基本步骤为:
先清理以前生成的文件;打开-O3开关编译文件;运行文件
思考题3:Intel C++ Compiler的优化性能参数主要有哪些,其优化性能体现在?(实验结果予以说明)
思考题4:Intel VTune Performance Analyzer的主要功能?
1.取样功能
文档评论(0)