2024 中国具身智能创投报告.pptx

下载文档

13
0
约1万字
约 27页
2024-08-03 发布于云南
举报
版权申诉
保障服务

2024 中国具身智能创投报告.pptx

1、本文档共27页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

04具身智能融资梳理代表创企

03国内具身智能赛道创业格局

具身智能背景现状

普通机器人

具身智能机器人

自主性

按预设程序执行任务

可自主完成任务

感知能力

只有基本的感知能力

具备高级的感知系统，如视觉、听觉、触觉等

交互能力

依赖于编程指令或外部控制

与环境和人类进行复杂交互

学习能力

依靠人工进行编程或更新

可实现自我进化和适应性学习

适应能力

只能在预设的参数或条件下工作

可在变化的环境中自主调整行为

应用场景

适用于结构化环境和重复性任务

可用于未知环境和复杂任务

具身智能机器人与普通机器人的区别主要集中在自主性、感知与交互能力、学习与适应能力、应用场景等方面。

具身智能定义

谷歌继去年推出首个控制机器人的视觉-语言-动作模型RT-2之后，于今年3月又推出RT系列的必威体育精装版模型RT-H，在多个任务评估中相比RT-2平均提高了15%的成功率。

英伟达今年2月宣布成立GEAR（GeneralistEmbodiedAgentResearch）实验室，专注通用具身智能体研究；在3月的GTC大会上，英伟达发布人形机器人通用基础模型ProjectGR00T，以及专为人形机器人打造的新型计算平台JetsonThor。

微软不仅和英伟达、OpenAI一起投资了具身智能明星创企FigureAI，今年5月还与仿人机器人公司SanctuaryAI达成合作，为其提供Azure云资源、加速具身AI研究。

OpenAI与Figure、1XTechnologies等公司合作开发机器人大模型，并将视觉语言模型加持在Figure01人形机器人上；同时时隔四年重新组建了自己的机器人团队。

特斯拉持续发布擎天柱（Optimus）机器人的演示视频，展示其从叠衣服、散步到进厂分拣电池的必威体育精装版进展。

具身智能火热现状

斯坦福大学李飞飞团队推出VoxPoser，基于环境信息和自然语言命令，通过大语言模型和视觉语言模型的交互，指导系统为机器人生成相应的操作指示地图。李飞飞教授今年也发起「空间智能」方向的创业项目，目标让AI像人类一样对视觉信息进行高级推理。

卡内基梅隆大学研发出OmniH2O（OmniHuman-to-Humanoid）全身遥控系统，实现全尺寸人形机器人的实时全身远程操作，并用宇树科技的H1-ReS人形机器人做了效果演示。

北京大学推出一系列具身智能研究成果，包括具身导航系统DiscussNav、具身大模型ManipLLM、机器人多模态大模型RoboMamba等。

清华大学、中南大学研发出具身智能体开放平台LEGENT，利用所生成的数据训练视觉-语言-动作模型。

智源研究院在今年6月的智源大会上推出世界首个端到端基于视频的多模态具身大模型NaVid。

具身智能火热现状

对通用机器人而言，大模型提供了更强

大的“AGI大脑”，提升了机器人在感知、理解和规划任务上的泛化能力，也对人机交互产生颠覆性影响。

具身智能火热原因：大模型及生成式AI的快速发展

大模型与机器人耦合，激发人们对AGI的想象

具身智能技术原理与路线

能力拆解

感知

控制

技术原理

上层

底层

中层

以「GoogleRT-2」为代表，通过一个神经网络完成从任务目标输入到行为指令输出的全过程。首先在大规模互联网数据预训练视觉语言模型，然后在机器人任务上微调，结合机器人动作数据，推出视觉语言动作模型。RT-2不仅负责最上层的感知与规划，还参与中下层的控制与执行，打通了端到端的链路。端到端模型的缺点是：训练数据海量、消耗资源巨大、机器人执行实时性差。

以「Figure01」为代表，将任务分解成不同层级，以多个神经网络训练，再以流程管线的方式组合。Figure01顶层接入OpenAI的多模态大模型，提供视觉推理和语言理解；中间层神经网络策略作为小脑进行运动控制并生成动作指令；底层机器人本体接受神经网络策略的动作指令，进行控制执行。分层决策模型的缺点是：不同步骤间的对齐和一致性需解决。

技术路线

具身智能的算法方案可分为分层决策模型和端到端模型两种路线。

图：RT-2模型闭环控制流程，来源ht

您可能关注的文档

文档评论（0）

随风飘落 + 关注: 实名认证

内容提供者

人力资源管理师持证人

一个写作爱好者，与大家分享

咨询Ta 进入空间

领域认证该用户于2023年07月07日上传了人力资源管理师

1亿VIP精品文档

更多 >

2024 中国具身智能创投报告.pptx