- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
请阅读最后一页的重要声明!
DeepSeek开源六连击,尽显极客风采
投资评级
投资评级:看好(维持)
最近12月市场表现
计算机沪深300上证指数
38%
24%
11%
-2%
-16%
-29%
相关报告
相关报告
1.《再提加强平安中国建设,重视“AI+公共安全”》2025-03-02
2.《英伟达业绩指引均超预期,Blackwell增长强劲》2025-02-27
3.《一文解读智能驾驶“端到端2.0”-VLA模型》2025-02-27
证券研究报告
核心观点
核心观点
DeepSeek开源周:更大的吞吐,更低的延迟,更极致的性价比。DeepSeek在2月24日至28日进行了为期5天的开源周“技术轰炸”,开源了5大代码库,覆盖训练、推理、通信、负载均衡以及数据加速的全链路,惊喜连连。开源周第1天发布FlashMLA,一款专为Hopper架构打造的高效MLA解码器,可高效处理变长序列,优化内存管理,榨取GPU极致性能。开源周第2天发布DeepEP,聚焦通信资源利用,提升数据高效传输,是首个为MoE量身定制的灵活GPU资源控制通信库。开源周的第三天,DeepSeek推出了支持稠密和MoE模型的FP8计算库——DeepGEMM,核心逻辑仅约300行代码直面AI计算中最频繁的矩阵乘法,可为V3/R1的训练和推理提供强大支持。开源周第4天,DeepSeek推出了一系列优化并行策略,包括DualPipe——一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法;以及EPLB——一个针对V3/R1模型的专家并行负载均衡工具,并深入分析了V3/R1模型中的计算与通信重叠机制。开源周的最后一天,DeepSeek发布了3FS并行文件系统,旨在应对人工智能训练和推理工作负载带来的挑战。该系统利用现代固态硬盘(SSDs)和RDMA网络,提供一个共享存储层,从而简化分布式应用程序的开发,并加速DeepSeek平台上所有数据访问操作。
OneMoreThing:DeepSeek-V3/R1推理系统实现大模型推理545%理论成本利润率。在开源周结束5天“技术轰炸”后,DeepSeek于第6天惊喜发布关于DeepSeek-V3/R1推理系统概述的文档,展示了如何通过跨节点并行、负载均衡和动态资源管理实现高吞吐量、低延迟和高性价比的推理服务,以实现545%理论成本利润率。DeepSeek提出了三种负载均衡器:PrefillLoadBalancer、DecodeLoadBalancer和Expert-ParallelLoadBalancer。它们分别针对不同的核心问题进行优化,目标是为每个GPU分配均衡的计算和通信负载,从而提高整体系统效率。
DeepSeek开源六连击,尽显极客风采:DeepSeek开源周上接连不断的技术发布,彰显了团队的极客精神和开源理念。正如其官方所言:“这里没有象牙塔,只有秉持纯粹的车库创业精神和社区驱动的创新理念。”此次FlashMLA项目中同样包含了一行内联代码,这表明DeepSeek团队深入至高级编程语言CUDA和GPU的底层机器代码之间,对GPU的并行计算、内存访问等进行更加细致的控制,进一步提升程序的性能。这不仅体现了团队对算法的深耕,也展现了他们对效率的极致工程化追求。
投资建议:我们对计算机行业维持看好评级。见正文。
风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。
行业专题报告
行业专题报告/证券研究报告
谨请参阅尾页重要声明及财通证券股票和行业评级标准2
内容目录
内容目录
1DeepSeek开源周:更大的吞吐,更低的延迟,更极致的性价比 3
1.1开源周第1天:FlashMLA,专为Hopper打造的高效MLA解码器 3
1.2开源周第2天:DeepEP,首个为MoE量身定制的灵活GPU资源控制通信库 5
1.3开源周第3天:DeepGEMM,直面AI计算中最频繁的矩阵乘法 7
1.4开源周第4天:优化并行
您可能关注的文档
- AI应用新纪元:引爆“人工智能+消费”革命-华西证券.docx
- Deepseek冲击波:电新全面智能时代开启.docx
- 冲锋衣行业市场趋势监测报告.docx
- 儿童隐形正畸品牌口腔抖音小红书内容策略及传播推广方案.docx
- 联想集团:中国企业智能化成熟度报告.docx
- 母婴服装品牌纱布系列产品小红书抖音种草策划案【TVC短视频】【跨界礼盒】【联名】.docx
- 奇点临近,行业变革:DeepSeek模型解读PPT.docx
- 汽车品牌新车型上市小红书营销【汽车】【种草营销】.docx
- 汽车智驾行业的梳理与思考(二):特斯拉FSD入华,国内智驾拐点加速临近.docx
- 综合感官反应反对身体攻击对策sense and reactagainst.pdf
- 课件春下册英冀教版unit 5 love learning english课后作业.pdf
- 讲稿文案精英p4ita310.pdf
- 供应链与供应商绩效管理.pdf
- unit 11单元整体教学设计-大七级英语下册同步备课系列人教版.pdf
- 分散数据共享网络bottos whitepaper english final.pdf
- panther摘要计划描述401k summary plan.pdf
- 画法几何系秋季讲.pptx
- 课件春下册英冀教版unit 5 love learning english课后作业.pptx
- imaging of drug-induced complications system药物诱导系统并发症成像.pdf
- xjgc erp项目培训材料层sd v1.pptx
最近下载
- 学校是我家清洁靠大家主题班会PPT课件.ppt VIP
- 2025年广东省汕头市中考作文猜题及范文分析.pdf
- AutoCAD软件二次开发:AutoLISP编程入门.pdf
- 自考操作系统知识点..doc VIP
- 2024年深圳市深大附中小升初入学分班考试数学模拟试卷附答案解析优质 完整版727635831.pdf
- 儿科学教学课件:地中海贫血 (珠蛋白生成障碍性贫血).pptx
- 基于CCD的管状产品尺寸检测.doc
- 2022年全国中小学信息技术创新与实践大赛考试参考题库(全真题库).pdf VIP
- 听力与言语康复学基础知识单选题100道及答案解析.docx VIP
- 2025年江西工业贸易职业技术学院单招职业技能考试题库及答案.docx
文档评论(0)