计算机行业华为系列深度之十五-AI算力软件生态：难以突破吗？.pptxVIP

下载本文档

0
0
约8.47千字
约 26页
2024-10-19 发布于境外
举报
版权申诉

计算机行业华为系列深度之十五-AI算力软件生态：难以突破吗？.pptx

1、本文档共26页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

证券研究报告3总结：两条路径，各自突破AI芯片的整体性能=AI芯片硬件性能×（GPU编程平台+深度学习框架支持）AI芯片公司需要投入的优化生态壁垒产生的根源在于软硬件的高度耦合最大的工作量是对海量算子和特定芯片的支持突破CUDA的两类方式AI芯片公司所采取的不同突围路线优劣势兼容CUDA自成体系12AMD海光信息华为寒武纪其他谷歌兼容CUDA的路线，借力英伟达生态自行维护Pytorch、Tensorflow后端算子，开发者共建算子生态深度学习框架+AI芯片”自研路线难点在于其更新迭代速度永远跟不上CUDA并且很难做到完全兼容华为：人才供给充足，各类算子开发进展较快，但由于开放较多底层优化，开发难度大，用户不友好谷歌：Tensorflow提供强耦合支持，但芯片设计过于专用，非谷歌人员使用有壁垒芯片本身性能以及算子库丰富程度还有追赶空间解决用户学习成本问题，实现无痛切换1）上层转换器，如ROCmHipifyTools2）底层二进制机器码实时转译，已被禁止，有法律风险对厂商人才、技术、资金、品牌实力要求较高，需要以非市场化途径切入市场，培育用户习惯和生态

主要内容软件工具：AI芯片的“大管家”训练端：后进入者竞争CUDA两类方式推理端：ONNX为“中间人”，软件生态百花齐放相关公司风险提示4

证券研究报告数学表达—计算图1）张量计算引擎+2）自动求导机制=高层算子，例如全连接、卷积、optimizerRuntime51.1软件工具栈：AI芯片的大管家AI开发框架编译器Driver（KernelMode）Toolkit工具（容器Docker）Library库DriverAPI（UserMode）DeveloperToolsHost主机设备科学库和实用程序库例如cuDNN最基础库，包含前向、后向卷积、激活函数、归一化、张量变换等开发者工具例如优化器、调解器等运行时（工作台）封装了DriverAPI,设备管理、流管理、内存管理、时间管理、统一寻址等驱动与Runtime功能类似，但能进行更底层控制Device内核驱动驱动GPU计算单元执行Kernel核函数功能，完成计算GPU编程平台资料来源：英伟达官网，CSDN（中国开发者网络），申万宏源研究

证券研究报告61.2开发框架寡头垄断但逐渐解耦，GPU编程平台各居一隅NVidiaCUDANvidia芯片MetaPytorch谷歌TensorflowCaffe百度飞桨华为Mindspore…AMDROCmAMDMI系列华为昇腾CANN华为昇腾海光信息DTK海光DCU寒武纪BANG寒武纪MLU……OpenCL百比分50%75%100%其他PytorchTensorflow2019 2020202125%0%2018AI开发框架：Meta维护的开源项目Pytorch、谷歌Tensorflow双寡头，原生支持Nvidia，AMD、华为、寒武纪等陆续支持（非原生），逐渐解耦。GPU编程平台：各家都有自有硬件+自有GPU编程平台产品，且基本上为绑定状态。强支持（后端生态）弱支持（前端生态）紧耦合半耦合资料来源：51CTO（无忧创想数字化人才学习平台），申万宏源研究Paperwithcode网站论文使用Pytorch比例快速提升Vulkan

1.3出现这么多GPU编程平台的原因？指令集、硬件架构不同深度学习框架厂商仅支持一家AI芯片就要投入巨大工程量，因此导致其最终只选择市占率最大的1-2家进行深度支持CUDA获得Pytorch、Tensorflow原生支持指令集不同汇编语言不同智能编程语言不同工具不兼容每家一个GPU编程平台CUDA生态自我强化英伟达AMD谷歌TPU华为昇腾寒武纪海光信息GPU编程平台CUDAROCmXLACANNBANGDTKC语言编译器NVCCHCC传统编译器毕昇编译器CNCCLLVM汇编语言SASS？?AscendCLMLISA？指令集PTX（闭源）？（技术文档已公开）CISC？MLU？英伟达H100硬件计算单元（左）和华为昇腾910硬件计算单元（右）架构差异较大证券研究报告资料来源：英伟达官网，《HuaweiResearch》（华为研究），CSDN（中国开发者网络），申万宏源研究7

证券研究报告81.4非NVAI芯片厂商的竞争策略：开源开放or自成体系其他AI芯片硬件与英伟达竞争，有两种方式开放开源：尽可能方便开发者，兼容CUDA，同时其他（如指令集等）尽可能开放自成一派：从AI开发框架-GPU编程平台-底层硬件完全走自己的路线兼容CUDA自成体系AMD海光信息百度昆仑芯华为阿里平头哥寒武纪摩尔线程、沐曦等谷歌TPU NvidiaInt