网站大量收购独家精品文档,联系QQ:2885784924

汽车行业DeepSeek对智能驾驶影响几何?.docx

汽车行业DeepSeek对智能驾驶影响几何?.docx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

正文目录

TOC\o1-2\h\z\uDeepSeek有望加速高阶智能驾驶落地 4

DeepSeek引领AI产业技术革新 4

DeepSeek技术创新对智能驾驶有重要借鉴意义 10

DeepSeek是智驾重要工具,而非颠覆格局 15

模型蒸馏:高质量教师模型、低数据损失成为重要因素 18

成本优化:DeepSeek成本优势拓宽智驾工程化应用边界 21

投资建议:推荐积极布局且智能化技术领先的公司 24

整车:关注技术领先且销量兑现的车企 24

零部件:关注积极布局智能驾驶产业的供应商 26

风险提示 27

图表目录

图表1:DeepSeek-V3与不同模型性能对比 4

图表2:DeepSeek-R1与不同模型性能对比 5

图表3:DeepSeek-R1训练流程 6

图表4:DeepSeek-V3基本架构示意图 7

图表5:DeepSeek多Token(MTP)预测架构 8

图表6:采用FP8数据格式的混合精度训练框架 9

图表7:DeepSeek-R1-Zero与OpenAIo1系列模型在推理相关基准测试中的对比9图表8:DeepSeek-R1蒸馏模型与其他可比模型在推理相关基准测试中的对比.10图表9:DeepSeek在数据增强和合成方面潜在应用 11

图表10:知识蒸馏实时数据处理和增量学习中的应用 12

图表11:模型蒸馏在自动驾驶开发场景中的应用 13

图表12:知识蒸馏助力自动驾驶开发 14

图表13:人类驾驶与现有自动驾驶系统之间的关系 16

图表14:DriveDreamer世界模型 17

图表15:DriveDreamer世界模型整体框架 17

图表16:世界认知模型可以实现更好地帮助端到端大模型认知世界 18

图表17:大模型阶段后,智能驾驶从车端模型向车云协同模型升级 19

图表18:云端蒸馏后完成车端模型的部署 19

图表19:各家AI车企云端训练算力部署规模 20

图表20:各家车企智能驾驶2023年至今累计里程数据 20

图表21:多模态模型蒸馏流程 21

图表22:多模态模型蒸馏降损流程 21

图表23:智能化发展过程中,学术化——工程化——商业化落地节奏 22

图表24:DeepSeek通过深度优化算法架构实现成本的下探 23

图表25:华为小艺介入DeepSeek 23

图表26:吉利汽车与DeepSeek加速融合 23

图表27:特斯拉重要版本迭代间隔逐步缩短 24

DeepSeek有望加速高阶智能驾驶落地

DeepSeek引领AI产业技术革新

DeepSeek技术创新引领AI产业变革。随着2024年底以及2025年初深度求索发布DeepSeek-V3和DeepSeek-R1模型,凭借一系列独创性和改进性技术以及精妙的策略,实现了与全球最强AI模型的匹敌,标志着我国在AI大模型领域实现技术突破。训练端,DeepSeek通过自研DualPipe训练框架、8位浮点量化技术、改进的MoE和

MTP等创新技术,有效提升了计算效率,大幅降低训练成本。推理端,DeepSeek通过MLA技术、改进的RL和蒸馏技术,大幅提升了推理效率,其性能可与全球顶尖AI模型匹敌。我们认为,凭借架构和算法的优化以及全面开源策略,DeepSeek有望引领全球AI大模型技术革新,加速AI大模型在各个领域的应用落地。

图表1:DeepSeek-V3与不同模型性能对比

DeepSeek-V3TechnicalReport》,

图表2:DeepSeek-R1与不同模型性能对比

DeepSeek-R1》,

DeepSeek通过技术创新实现高性能和低成本。架构方面,DeepSeek-V3基于Transformer框架,通过多头潜在注意力(MLA)、DeepSeek混合专家模型

(DeepSeekMoE)、无辅助损失的负载均衡策略以及多令牌预测(MTP)等核心创新进行架构设计。训练方面,通过自研DualPipe算法和基于FP8数据格式的混合精度训练框架,减少训练内存需求,提升训练效率。推理方面,DeepSeek-R1基于DeepSeek-

V3基础模型,通过大规模强化学习技术增强推理能力,成功地将强化学习带来的强推理能力泛化到其他领域;同时采用模型蒸馏技术,显著提升小模型的推理能力。

图表3:DeepSeek-R1训练流程

智东西,

DeepSeek-V3架构创新

公司在模型架构设计

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档