网站大量收购独家精品文档,联系QQ:2885784924

通信-行业周报:DeepSeek:模型效率的革命,算力基建的新起点.pdfVIP

通信-行业周报:DeepSeek:模型效率的革命,算力基建的新起点.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

通信

DeepSeek:模型效率的革命,算力基建

【我们团队对于DeepSeek理解,可以用一个非常巧妙的比喻来概括:

内燃机效率的提高,一定会带来更大的石油消耗】

DeepSeek做了什么:

【1】验证了新的ScalingLaw:在过去的几年间,AI模型的增长主

要依靠于预训练阶段的规模堆积,通过对人类已有数据的不断积累,

从而增加模型的规模和能力。但随着训练耗尽了人类已有数据,叠加

合成数据之路所产生的幻觉和边际收益递减问题,预训练阶段的

ScalingLaw逐渐放缓。2024年以来,基于强化学习的新ScalingLaw

成为了行业重点方向,先后涌现出了GPT-o1,DeepseekR1等优秀模

型。RL这种新的AI增长曲线,在初期展现出了非常高的投入性价比,

这也是DeepseekV3快速进化到R1,并展现出强大能力的根本原因。

当下RL依然是基于传统的预训练模型,在推理阶段加入RL使得模型

面对理科问题时的推理技能更加强大。展望未来,随着RL算法在预训

练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,

基于RL算法训练模型生成思维链,将共同构成AI新的ScalingLaw,

算法创新与算力堆叠在这条曲线上将一起狂奔,AI的能力边界将迎来

新一轮的扩张。

【2】极致的工程优化:DeepSeek的真正创新之处在于极致的工程优

化,主要依靠了如键值缓存,创新型的MoE架构,以及基于PTX层汇

编语言实现对于英伟达GPU效率的极致压榨等等,通过这些创新性的

工程优化,使得DeepSeek打破了西方模型公司固有的降本周期曲线,

能够用更低的价格,来提供接近头部模型的使用体验,提高了全球算

力的使用效率。

【3】慷慨的开源:与西方以OAI和Anthropic为代表模型巨头,逐渐

走向闭源的模型商业理念不同,DeepSeek将自身创新性原理和模型进

行了开源,一方面使得全球模型厂商能够共享新的工程方法带来的性

价比提升,另一方面使得全球用户能够本地或者通过公有云部署,从

而避免高溢价,这也是Deepseek在全球开发者中获得如此高殊荣的

核心原因。

DeepSeek对于英伟达的影响:

Deepseek的出现,让全世界看到AGI的实现又更近了一步。我们认

为,海外在算力领域的布局不会因为deepseek有所放缓,相反,因为

deepseek的出现,将会给全球科技巨头进一步上紧发条,海外科技巨

头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一

步加大英伟达GPU采购力度,另一方面也会加紧推进自研ASIC方案

的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力

层面上进行最后的封锁,以限制其他国家地区的AI发展,维护其所谓

的AI领先地位。

对于英伟达而言,我们认为,deepseek的阶段性胜利,将继续推动算

力市场的整体需求,长期的天花板进一步被打开,我们不认为英伟达

请仔细阅读本报告末页声明

的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步

超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,

性能有望实现重大突破的极具创新型技术路线(如CPO、OIO等),

我们认为有望继续提速。我们认为英伟达的股价下跌并非反应的是需

求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而

带来的不确定性。

DeepSeek对于中国算力投资的影响

【对于国产算力】:DeepSeek推出后,美国迫于竞争压力,对于中国

进一步加强算力制裁的呼声愈发强大。同时由于DeepSeek开源和低

成本特性,国产显卡用于推理的性价比和ROI急剧上升,至此,基于

中芯国际的制造能力,芯片厂商的设计能力,Deepseek模型的应用能

力三者合一,中国算力自主可控的飞轮开始旋转。

【对于边缘侧】:DeepSeek对于边缘侧的拉动主要有两点,第一是云

端先进模型的价格降低,使得AI应用,AI硬件的使用和开发运营成本

降低,这将促进AI硬件的放量。第二是DeepSeek对于小模型优化的

能力,此次Deepseek也基于Qwen与Llam

文档评论(0)

Seeker研报 + 关注
实名认证
文档贡献者

如果有被下架的,可以私我发你,欢迎垂询各种研究报告!也可以咨询定制获取特定主题报告,欢迎光临!

1亿VIP精品文档

相关文档