2024 中国具身智能创投报告.pptx

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

04具身智能融资梳理代表创企

03国内具身智能赛道创业格局

具身智能背景现状

01

普通机器人

具身智能机器人

自主性

按预设程序执行任务

可自主完成任务

感知能力

只有基本的感知能力

具备高级的感知系统,如视觉、听觉、触觉等

交互能力

依赖于编程指令或外部控制

与环境和人类进行复杂交互

学习能力

依靠人工进行编程或更新

可实现自我进化和适应性学习

适应能力

只能在预设的参数或条件下工作

可在变化的环境中自主调整行为

应用场景

适用于结构化环境和重复性任务

可用于未知环境和复杂任务

具身智能机器人与普通机器人的区别主要集中在自主性、感知与交互能力、学习与适应能力、应用场景等方面。

具身智能定义

谷歌继去年推出首个控制机器人的视觉-语言-动作模型RT-2之后,于今年3月又推出RT系列的必威体育精装版模型RT-H,在多个任务评估中相比RT-2平均提高了15%的成功率。

英伟达今年2月宣布成立GEAR(GeneralistEmbodiedAgentResearch)实验室,专注通用具身智能体研究;在3月的GTC大会上,英伟达发布人形机器人通用基础模型ProjectGR00T,以及专为人形机器人打造的新型计算平台JetsonThor。

微软不仅和英伟达、OpenAI一起投资了具身智能明星创企FigureAI,今年5月还与仿人机器人公司SanctuaryAI达成合作,为其提供Azure云资源、加速具身AI研究。

OpenAI与Figure、1XTechnologies等公司合作开发机器人大模型,并将视觉语言模型加持在Figure01人形机器人上;同时时隔四年重新组建了自己的机器人团队。

特斯拉持续发布擎天柱(Optimus)机器人的演示视频,展示其从叠衣服、散步到进厂分拣电池的必威体育精装版进展。

具身智能火热现状

斯坦福大学李飞飞团队推出VoxPoser,基于环境信息和自然语言命令,通过大语言模型和视觉语言模型的交互,指导系统为机器人生成相应的操作指示地图。李飞飞教授今年也发起「空间智能」方向的创业项目,目标让AI像人类一样对视觉信息进行高级推理。

卡内基梅隆大学研发出OmniH2O(OmniHuman-to-Humanoid)全身遥控系统,实现全尺寸人形机器人的实时全身远程操作,并用宇树科技的H1-ReS人形机器人做了效果演示。

北京大学推出一系列具身智能研究成果,包括具身导航系统DiscussNav、具身大模型ManipLLM、机器人多模态大模型RoboMamba等。

清华大学、中南大学研发出具身智能体开放平台LEGENT,利用所生成的数据训练视觉-语言-动作模型。

智源研究院在今年6月的智源大会上推出世界首个端到端基于视频的多模态具身大模型NaVid。

具身智能火热现状

对通用机器人而言,大模型提供了更强

大的“AGI大脑”,提升了机器人在感知、理解和规划任务上的泛化能力,也对人机交互产生颠覆性影响。

具身智能火热原因:大模型及生成式AI的快速发展

大模型与机器人耦合,激发人们对AGI的想象

具身智能技术原理与路线

02

能力拆解

感知

控制

技术原理

上层

底层

中层

以「GoogleRT-2」为代表,通过一个神经网络完成从任务目标输入到行为指令输出的全过程。首先在大规模互联网数据预训练视觉语言模型,然后在机器人任务上微调,结合机器人动作数据,推出视觉语言动作模型。RT-2不仅负责最上层的感知与规划,还参与中下层的控制与执行,打通了端到端的链路。端到端模型的缺点是:训练数据海量、消耗资源巨大、机器人执行实时性差。

以「Figure01」为代表,将任务分解成不同层级,以多个神经网络训练,再以流程管线的方式组合。Figure01顶层接入OpenAI的多模态大模型,提供视觉推理和语言理解;中间层神经网络策略作为小脑进行运动控制并生成动作指令;底层机器人本体接受神经网络策略的动作指令,进行控制执行。分层决策模型的缺点是:不同步骤间的对齐和一致性需解决。

技术路线

具身智能的算法方案可分为分层决策模型和端到端模型两种路线。

图:RT-2模型闭环控制流程,来源ht

文档评论(0)

随风飘落 + 关注
实名认证
内容提供者

人力资源管理师持证人

一个写作爱好者,与大家分享

领域认证该用户于2023年07月07日上传了人力资源管理师

1亿VIP精品文档

相关文档