- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2025中国汽车流通行业
新春启航大会暨促消费大会
大模型时代的新能源汽车自动驾驶发展趋势;
一、范式变革:基于多模态大模型的自动驾驶技术
二、世界模型驱动的一段式端到端解决方案可望获得突破
三、发展趋势:从感知智能到认知智能
清华大学人工智能研究院视觉智能研究中心
VisualIntelligenceResearchCenter(VIRC),InstituteforArtificialIntelligence,TsinghuaUniversity;
一、范式变革:基于多模态大模型的自动驾驶技术
二、世界模型驱动的一段式端到端解决方案可望获得突破
三、发展趋势:从感知智能到认知智能
清华大学人工智能研究院视觉智能研究中心
VisualIntelligenceResearchCenter(VIRC),InstituteforArtificialIntelligence,TsinghuaUniversity;
VLA融合了感知空间与动作空间,给出了两个空间与三大任务:
?两大空间:从感知或观察空间到动作空间,还是从动作空间到感知空间?
?两个空间之间的单段式或单模型一体化相互作用;
?三个下游微调模型,即三大任务:具身理解、具身推理与具身动作生成大模型;
?基于上述三大微调模型,可优化训练更多的下游微调模型;
-性能增强的VLA:可望提升图像、视频、3D点云与语义地图等多模态数据的
语义对齐水平,从而获得更好的交叉理解;;
-性能增强的VLA:也可望改善开放场景下的实例分割与目标检测准确率,实现
更好的视觉“分词”;;
-性能增强的VLA:对时空动态场景的预测,或将有效嵌入真实世界的物理学规
律,从而获得更好的避碰能力;;
-性能增强的VLA:通过进一步引入小脑模型,可望获得更加精准、鲁棒与细滑
的行为与动作生成。;
VLA的决策推理势必面临更大的挑战,但却更有研发意义与落地应用价值,包括:
?安全、效率、舒适度与低碳等多指标评估体系及其动态优化算法;
?利用推理大模型DeepSeek等的应用潜力,如完成百万量级合成场景训练下的决策鲁棒性验证实验(将接管率推进到每10万公里1-3次),将轨迹规划的实时响应时间从传统的150ms缩短至50ms左右。;
一、范式变革:基于多模态大模型的自???驾驶技术
二、世界模型驱动的一段式端到端解决方案可望获得突破
三、发展趋势:从感知智能到认知智能
清华大学人工智能研究院视觉智能研究中心
VisualIntelligenceResearchCenter(VIRC),InstituteforArtificialIntelligence,TsinghuaUniversity;
-实现工业化合成数据,包括利用世界模型与世界模拟器生成百万量级的边缘事
件时空场景,实现世界模型引擎与真实路测数据的闭环验证,不仅获得更加逼真的场景模拟,而且可大幅降低时空场景数据合成的生产成本。;
-4D时空世界模拟:3维空间+1维时间,智能体在4D世界中与环境、其他智能体及人
类进行交互式学习,以端到端数据驱动方式实现物理规律模拟,从而获得空间智能。;
-数字孪生虚实平行世界:利用数字孪生系统基于深度强化学习的自主决策与最优策略的虚实迁移;
-反哺AGI的发展:由此获得的虚实交互数据,可进一步反哺通用智能体与通用人工智能的发展。;
-感知设备:对纯视觉解决方案,是否需要额外增加4D毫米波雷达进行多传感器融合?;
-车载计算平台:2025年英伟达2000TOPS算力Thor芯片可望量产,五年内车载存算一体芯片是否能突破更高的能效比瓶颈?;
-大模型上车:车侧一段式端到端模型上
车的AI硬件算力支撑的模型蒸馏压缩与轻量化,是否可以支撑百亿级别参数规模的密集大模型上车?;
AI硬件架构变革对大型语言模型及智能体的发展起着关键支撑作用。反过来,人
工智能中模型、架构与算法的创新,可以产生基础性的事半功倍的效果。
主要包括:
1)底座模型创新,发展具有线性复杂性的下一代基础大型语言模型。目前绝大多数大语言模型都是基于Transformer架构的,这种注意力神经网络模型具有平方量级的计算复杂性,也无长期记忆、持续记忆与在线学习能力。
从大语言模型如何走向世界模型?
DeepSeek的成功再一次表明了大模型基础与技术创新的重要性。;
AI硬件架构变革对大型语言模型及智能体的发展起着关键支撑作用。反过来,人
工智能中模型、架构与算法的创新,可以产生基础性的事半功
您可能关注的文档
- 2024基于人工智能技术的云遥感反演-复旦大学@张峰-55页.pdf
- 2025网络安全趋势-绿盟科技-46页.pdf
- 人形机器人行业报告(六):机器人量产时刻,互动感知能力有望成为迭代重点-28页.docx
- 2025年第一季度中国大陆劳动法指南报告-连智领域Links.docx
- 浙江大学:走向数字社会:从Deepseek到群体智慧.docx
- 2025年中国睡眠健康研究白皮书-中国睡眠研究会&华为运动健康.docx
- 势银绿色液体燃料产业发展蓝皮书(2025)-霍尼韦尔.docx
- 通信行业研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾-22页.docx
- 2025年热水器健康用水白皮书-中国家用电器研究院.docx
- 2024基于人工智能技术的云遥感反演-复旦大学@张峰-55页.pptx
- 市人大办副主任2024带头增强党性、严守纪律、砥砺作风等四个方面存在的问题及整改措施对照发言材料4篇(四个带头+典型案例剖析).docx
- 深入贯彻中央八项规定精神学习教育专题辅导授课讲稿.docx
- 深化零基预算改革面临的问题困难及对策建议及深化市级零基预算改革方案.docx
- 某邮政公司2024年度基层党建工作整改报告材料.docx
- 某党政办主任2024带头增强党性、严守纪律、砥砺作风等四个方面存在的问题及整改措施个人对照检查发言提纲范文(四个带头).docx
- 廉政党课6篇:坚定不移推进党风廉政建设和反腐败工作为全市高质量发展提供坚强保障.docx
- 纪检监察干部队伍教育整顿对照六个方面自查自纠检视剖析报告(3篇).docx
- 关于同志政治素养、廉洁自律的鉴定评价材料2篇.docx
- 关于司法局2024-2025年意识形态工作汇报5篇.docx
- 关于进一步提高党委理论学习中心组学习质量的实施意见+国企改革研讨交流材料.docx
文档评论(0)