- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
04具身智能融资梳理代表创企
03国内具身智能赛道创业格局
具身智能背景现状
01
普通机器人
具身智能机器人
自主性
按预设程序执行任务
可自主完成任务
感知能力
只有基本的感知能力
具备高级的感知系统,如视觉、听觉、触觉等
交互能力
依赖于编程指令或外部控制
与环境和人类进行复杂交互
学习能力
依靠人工进行编程或更新
可实现自我进化和适应性学习
适应能力
只能在预设的参数或条件下工作
可在变化的环境中自主调整行为
应用场景
适用于结构化环境和重复性任务
可用于未知环境和复杂任务
具身智能机器人与普通机器人的区别主要集中在自主性、感知与交互能力、学习与适应能力、应用场景等方面。
具身智能定义
谷歌继去年推出首个控制机器人的视觉-语言-动作模型RT-2之后,于今年3月又推出RT系列的必威体育精装版模型RT-H,在多个任务评估中相比RT-2平均提高了15%的成功率。
英伟达今年2月宣布成立GEAR(GeneralistEmbodiedAgentResearch)实验室,专注通用具身智能体研究;在3月的GTC大会上,英伟达发布人形机器人通用基础模型ProjectGR00T,以及专为人形机器人打造的新型计算平台JetsonThor。
微软不仅和英伟达、OpenAI一起投资了具身智能明星创企FigureAI,今年5月还与仿人机器人公司SanctuaryAI达成合作,为其提供Azure云资源、加速具身AI研究。
OpenAI与Figure、1XTechnologies等公司合作开发机器人大模型,并将视觉语言模型加持在Figure01人形机器人上;同时时隔四年重新组建了自己的机器人团队。
特斯拉持续发布擎天柱(Optimus)机器人的演示视频,展示其从叠衣服、散步到进厂分拣电池的必威体育精装版进展。
具身智能火热现状
斯坦福大学李飞飞团队推出VoxPoser,基于环境信息和自然语言命令,通过大语言模型和视觉语言模型的交互,指导系统为机器人生成相应的操作指示地图。李飞飞教授今年也发起「空间智能」方向的创业项目,目标让AI像人类一样对视觉信息进行高级推理。
卡内基梅隆大学研发出OmniH2O(OmniHuman-to-Humanoid)全身遥控系统,实现全尺寸人形机器人的实时全身远程操作,并用宇树科技的H1-ReS人形机器人做了效果演示。
北京大学推出一系列具身智能研究成果,包括具身导航系统DiscussNav、具身大模型ManipLLM、机器人多模态大模型RoboMamba等。
清华大学、中南大学研发出具身智能体开放平台LEGENT,利用所生成的数据训练视觉-语言-动作模型。
智源研究院在今年6月的智源大会上推出世界首个端到端基于视频的多模态具身大模型NaVid。
具身智能火热现状
对通用机器人而言,大模型提供了更强
大的“AGI大脑”,提升了机器人在感知、理解和规划任务上的泛化能力,也对人机交互产生颠覆性影响。
具身智能火热原因:大模型及生成式AI的快速发展
大模型与机器人耦合,激发人们对AGI的想象
具身智能技术原理与路线
02
能力拆解
感知
控制
技术原理
上层
底层
中层
以「GoogleRT-2」为代表,通过一个神经网络完成从任务目标输入到行为指令输出的全过程。首先在大规模互联网数据预训练视觉语言模型,然后在机器人任务上微调,结合机器人动作数据,推出视觉语言动作模型。RT-2不仅负责最上层的感知与规划,还参与中下层的控制与执行,打通了端到端的链路。端到端模型的缺点是:训练数据海量、消耗资源巨大、机器人执行实时性差。
以「Figure01」为代表,将任务分解成不同层级,以多个神经网络训练,再以流程管线的方式组合。Figure01顶层接入OpenAI的多模态大模型,提供视觉推理和语言理解;中间层神经网络策略作为小脑进行运动控制并生成动作指令;底层机器人本体接受神经网络策略的动作指令,进行控制执行。分层决策模型的缺点是:不同步骤间的对齐和一致性需解决。
技术路线
具身智能的算法方案可分为分层决策模型和端到端模型两种路线。
图:RT-2模型闭环控制流程,来源ht
文档评论(0)