- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
通信
DeepSeek:模型效率的革命,算力基建
【我们团队对于DeepSeek理解,可以用一个非常巧妙的比喻来概括:
内燃机效率的提高,一定会带来更大的石油消耗】
DeepSeek做了什么:
【1】验证了新的ScalingLaw:在过去的几年间,AI模型的增长主
要依靠于预训练阶段的规模堆积,通过对人类已有数据的不断积累,
从而增加模型的规模和能力。但随着训练耗尽了人类已有数据,叠加
合成数据之路所产生的幻觉和边际收益递减问题,预训练阶段的
ScalingLaw逐渐放缓。2024年以来,基于强化学习的新ScalingLaw
成为了行业重点方向,先后涌现出了GPT-o1,DeepseekR1等优秀模
型。RL这种新的AI增长曲线,在初期展现出了非常高的投入性价比,
这也是DeepseekV3快速进化到R1,并展现出强大能力的根本原因。
当下RL依然是基于传统的预训练模型,在推理阶段加入RL使得模型
面对理科问题时的推理技能更加强大。展望未来,随着RL算法在预训
练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,
基于RL算法训练模型生成思维链,将共同构成AI新的ScalingLaw,
算法创新与算力堆叠在这条曲线上将一起狂奔,AI的能力边界将迎来
新一轮的扩张。
【2】极致的工程优化:DeepSeek的真正创新之处在于极致的工程优
化,主要依靠了如键值缓存,创新型的MoE架构,以及基于PTX层汇
编语言实现对于英伟达GPU效率的极致压榨等等,通过这些创新性的
工程优化,使得DeepSeek打破了西方模型公司固有的降本周期曲线,
能够用更低的价格,来提供接近头部模型的使用体验,提高了全球算
力的使用效率。
【3】慷慨的开源:与西方以OAI和Anthropic为代表模型巨头,逐渐
走向闭源的模型商业理念不同,DeepSeek将自身创新性原理和模型进
行了开源,一方面使得全球模型厂商能够共享新的工程方法带来的性
价比提升,另一方面使得全球用户能够本地或者通过公有云部署,从
而避免高溢价,这也是Deepseek在全球开发者中获得如此高殊荣的
核心原因。
DeepSeek对于英伟达的影响:
Deepseek的出现,让全世界看到AGI的实现又更近了一步。我们认
为,海外在算力领域的布局不会因为deepseek有所放缓,相反,因为
deepseek的出现,将会给全球科技巨头进一步上紧发条,海外科技巨
头们将进一步加码在算力领域的布局。具体而言,一方面可能会进一
步加大英伟达GPU采购力度,另一方面也会加紧推进自研ASIC方案
的进度。此外,美国政府可能会进一步加紧芯片出口限制,试图在算力
层面上进行最后的封锁,以限制其他国家地区的AI发展,维护其所谓
的AI领先地位。
对于英伟达而言,我们认为,deepseek的阶段性胜利,将继续推动算
力市场的整体需求,长期的天花板进一步被打开,我们不认为英伟达
请仔细阅读本报告末页声明
的需求和订单会出现任何大幅度的影响,相反,一方面可能会进一步
超预期,另一方面英伟达可能也会将其下一代产品的迭代速度加速,
性能有望实现重大突破的极具创新型技术路线(如CPO、OIO等),
我们认为有望继续提速。我们认为英伟达的股价下跌并非反应的是需
求的变化,而更多应是担心可能发生的进一步加紧的芯片出口限制而
带来的不确定性。
DeepSeek对于中国算力投资的影响
【对于国产算力】:DeepSeek推出后,美国迫于竞争压力,对于中国
进一步加强算力制裁的呼声愈发强大。同时由于DeepSeek开源和低
成本特性,国产显卡用于推理的性价比和ROI急剧上升,至此,基于
中芯国际的制造能力,芯片厂商的设计能力,Deepseek模型的应用能
力三者合一,中国算力自主可控的飞轮开始旋转。
【对于边缘侧】:DeepSeek对于边缘侧的拉动主要有两点,第一是云
端先进模型的价格降低,使得AI应用,AI硬件的使用和开发运营成本
降低,这将促进AI硬件的放量。第二是DeepSeek对于小模型优化的
能力,此次Deepseek也基于Qwen与Llam
您可能关注的文档
- 美图公司(01357)DeepSeek推进技术平权,赋能AI图像应用深耕细作.pdf
- 青年群体个人养老金投资行为调查报告(2024).pdf
- 全方位照护—中国养老服务的关键模式.pdf
- 全球和中国碳市场回顾与展望(2025)-CEEP-BIT.pdf
- 全球体育行业调研(第八期)中国报告 - 大有可为(2024).pdf
- 人工智能-DeepSeek领衔,国产大模型竞争力加速迭代.pdf
- 人工智能动态跟踪:计算机行业:DeepSeek提振国产大模型信心,有望促进AI行业发展.pdf
- 人工智能生产内容(AIGC)作品版权认定分析报告.pdf
- 如何应对中国产业内卷式竞争-CMF(202501).pdf
- 商业航天行业研究报告 2024-追星登月,中美天穹争霸,我国商业航天迎来奇点时刻.pdf
- 奥美凯聚合物(苏州)有限公司行业竞争力评级分析报告(2023版).pdf
- 大连亨利测控仪表工程有限公司行业竞争力评级分析报告(2023版).pdf
- 昌吉市新铭泰新型材料科技有限公司行业竞争力评级分析报告(2023版).pdf
- 柏力开米复合塑料(昆山)有限公司行业竞争力评级分析报告(2023版).pdf
- 常州市兴诚高分子材料有限公司行业竞争力评级分析报告(2023版).pdf
- 安徽荣冠管业科技有限公司行业竞争力评级分析报告(2023版).pdf
- 保定贸正劳保用品制造有限公司行业竞争力评级分析报告(2023版).pdf
- 昌邑泰和新材料科技有限公司行业竞争力评级分析报告(2023版).pdf
- 东风线缆集团股份有限公司行业竞争力评级分析报告(2023版).pdf
- 成都正恒动力股份有限公司行业竞争力评级分析报告(2023版).pdf
文档评论(0)