网站大量收购独家精品文档,联系QQ:2885784924

基于粒子的数值模拟方法GPU加速的研究与应用.docVIP

基于粒子的数值模拟方法GPU加速的研究与应用.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 基于粒子的数值模拟方法 GPU 加速的研究 与应用# 林晨森,陈硕** 5 10 15 20 25 30 35 40 (同济大学航空航天与力学学院,上海 200092) 摘要:基于粒子的数值模拟方法在微观介观以及复杂现象的模拟中具有传统连续方法不具有 的优势,但其巨大的计算量对现有的计算硬件提出了挑战。利用 GPU 加速科学计算是近年来 的热点,本文介绍了将 GPU 应用于基于粒子的数值模拟方法时需要注意的问题,如优化数据 通信的策略、元胞列表法的并行化更新、随机数的并行化生成、多 GPU 加速的技术等,并介 绍了此领域的必威体育精装版应用成果。 关键词:粒子模拟 GPU CUDA 中图分类号:O0369 Research and Application on Accelerating Particle Based Numerical Simulation with GPU LIN Chensen, CHEN Shuo (School of Aerospace Engineering and Applied Mechanics,Tongji University,Shanghai 200092) Abstract: Although particle based numerical methed is superior to traditional continuous method in simulating microscopic,mesoscopic and complex phenomenon, it still suffers from large calculation costs. In recent years accelerating particle based numerical methed with GPU has become popular. In this paper, the issues such as data communication optimization strategy, parallel cell-list array updating, generating pseudo-random number on GPU, acclerating with multiple GPUs were discussed. Further more, the pioneering applications in this field were presented. Key words: particle simulation;GPU;CUDA 0 引言 基于粒子的数值模拟方法是研究微观、介观和复杂现象的常用数值模拟方法,它将模拟 区域看做许多离散粒子的集合,各粒子之间根据牛顿定律运动、相互碰撞,可以通过统计这 些粒子的各种参数来展现系统的行为。目前常见的粒子方法包括分子动力学方法、格子玻尔 兹曼方法、耗散粒子动力学方法、光滑粒子动力学方法、蒙特卡洛方法、流体粒子方法等。 基于粒子的数值模拟方法具有传统连续方法不具有的优势。但一般来说,粒子方法在模 拟体系的行时所采用的粒子数目是十分庞大的,即使算法中做了简化或采用粗粒化来降低对 计算能力的要求,仍然对目前计算机的运算速度提出了挑战。 在过去的半个世纪里,CPU 的摩尔定律一直未被打破,每隔 18 个月性能就将提升一倍, 这种前所未有的提升速度使编程者通过等待下一代处理器的出现就可以提高程序的性能,而 不用复杂的脑力劳动对程序进行改写。然而从 2002 年以后,单核处理器的性能提升降到了 每年 20%,相比于摩尔定律,十年的性能提升从 97 倍降到 6 倍,免费的午餐不再供应。 基金项目:中央高校基本科研业务费专项资金(125065) ;国家自然科学基金10872152)、教育 部高等学校博士学科点专项科研基金(20120072110037) 作者简介:林晨森(1988-),男,硕士研究生,主要研究方向:微流体,并行计算 通信联系人:陈硕(1969-),男,教授,微流体. schen_tju@ -1-  究其原因,因为 CPU 上的晶体管包含 3 个电极,分别是源极、漏极和作为控制电极的 栅极。如果给栅极增加电压的话,分隔区域就会打开一个通道,帮助电子轮流从源极进入漏 极,此时晶体管处于“开”的状态。但是,当晶体管的结构越来越小的时候,即使栅极不加 电压,源、漏极之间仍然有电流通过。也就是说,在应该处于“关”的状态时,晶体管仍然 45 50 55 60 65 70 保持“开”的状态。该问题的存在意味着我们无法通过继续减小晶体管的体积来获得更高的 性能。2013 年最先进的制程工艺是 22nm,已经接近理论

文档评论(0)

文档分享 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档