- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
cuda编程指南3.1中文版
CUDA 编程指南3.1 中文版
译者:风辰
由于小弟的水平所限,此文档可能存在错误,如果你觉得本文档的某些内
容可能是错误,请联系我,我不能像高纳德一样给你2.56 美元,但是我会尽
快修正它,谢谢!
在本次更新过程中,很多地方参考了cyrosly 大牛的意见,对此表示感
谢!
任何人不得更改此文档内容或设置,更不能用于商业目的,否则后果自
负。
由于时间有限,本次更新不涉及驱动API,在此向大家表示抱歉!
1
目录
第一章 导论 6
1.1 从图形处理到通用并行计算 6
TM
1.2 CUDA :一种通用并行计算架构 7
1.3 一种可扩展的编程模型 8
1.4 文档结构 9
第二章 编程模型 10
2.1 内核 10
2.2 线程层次 10
2.3 存储器层次 12
2.4 异构编程 13
2.5 计算能力 15
第三章 编程接口 16
3.1 用nvcc 编译 16
3.1.1 编译流程 16
3.1.2 二进制兼容性 17
3.1.3 PTX 兼容性 17
3.1.4 应用兼容性 17
3.1.5 C/C++兼容性 17
3.1.6 64 位兼容性 18
3.2 CUDA C 18
3.2.1 设备存储器 18
3.2.2 共享存储器20
3.2.3 多设备25
3.2.4 纹理存储器26
3.2.5 表面存储器(surface)29
3.2.6 分页锁定主机存储器 31
3.2.7 异步并发执行 32
3.2.8 图形学互操作性 35
3.2.9 错误处理42
3.2.9 使用设备模拟模式调试(已删除) 42
3.3 驱动API 44
3.3.1 上下文46
3.3.2 模块47
3.3.3 内核执行47
3.3.4 设备存储器49
3.3.5 共享存储器 52
3.3.6 多设备 53
3.3.7 纹理存储器 54
3.3.8 分页锁定主机存储器 56
3.3.9 异步并发执行 56
3.3.10 图形学互操作性 57
3.3.11 错误处理 65
3.4 运行时API 和驱动API 的互操作性 65
3.5 版本和互操作性 66
3.6 计算模式 67
2
3.7 模式切换 67
第四章 硬件实现 68
4.1 SIMT 架构 68
4.2 硬件多线程 68
4.3 多设备 69
第五章 性能优化指南 71
5.1 总体性能优化策略 71
5.2 最大化利用率 71
5.2.1 应用层次 71
5.2.2 设备层次 71
5.2.3 多处理器层次 71
5.3 最大化存储器吞吐量 73
您可能关注的文档
- 双曲线知识点总结及例题讲解.pdf
- 苹果 iOS Blocks 编程指南(blocks语法学习教程-有详细代码指导说明).pdf
- 魔抓编程指南.pdf
- 谷歌C++编程指南.pdf
- 劳动争议案例汇编.pdf
- 北京市朝阳区食品安全管理制度.pdf
- 政治知识点归纳(2017填空).pdf
- 车身装配防错设计指南.pdf
- 糖尿病人自我调养经典书籍大全.pdf
- FM1702编程指南.pdf
- 一城一云服务城市高质量发展白皮书(2023).pdf
- 中国连锁餐饮企业资本之路系列报告(2023)-历尽千帆,厚积薄发.pdf
- 有色金属行业专题研究:未来焦点,钒液流电池储能风潮兴涌.pdf
- 中国 “一带一路”实践与观察报告.pdf
- 医药生物-消费器械行业2023年中报总结:积极拥抱高璧垒高成长(202309).pdf
- DB50T 699-2016 简易升降机检验规则.pdf
- DB50T 746-2016 水库大坝安全监测资料整编分析规程 .pdf
- 看DAO2025-未尽研究报告(2024).pdf
- 市场洞察力报告-数据安全检查工具箱(2024).pdf
- 2024年预见未来:中国元医院建设发展调研报告.pdf
文档评论(0)