网站大量收购闲置独家精品文档,联系QQ:2885784924

示教学习的总结.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

机器人的三代:

(1)可编程机器人:一般根据操作人员所编程序,完成一些简单的重复性操作。

(2)感知机器人:又叫做自适应机器人,它在第一代机器人的基础上发展起来,能够具有不同程度的“感知”周围环境的能力。

(3)智能机器人:将具有识别、推理、规划和学习等智能机制,它可以把感知和行动智能化结合起来,因此能在非特定的环境下作业智能机器人与工业机器人的根本区别在于,智能机器人具有感知功能与识别、判断及规划功能。而感知本身,就是人类和动物所具有的低级智能。因此机器的智能分为两个层次:①具有感觉、识别、理解和判断功能;②具有总结经验和学习的功能。所以,人们通常所说的第二代机器人可以看作是第一代智能机器人。

2.智能机器人的感官系统:

(1)触觉传感器:阵列触觉传感方器。

(2)视觉传感:①隔开物体的二维视觉:双态成像;②隔开物体的二维视觉:灰度标成像;③触觉或叠加物体的二维视觉;④二维观察;⑤二维线跟踪;⑥使用透视、立体、结构图示或范围找寻技术从隔开物体中提取三维信息。

(3)听觉传感:目前用的最多的是麦克风与机器人的自然语言理解系统。

(4)运动性能:机器人通常是要在周围移动物体的,例如:机器人臂到轮子或脚的运载器已有许多结构在使用,此外还有许多其他型号在研究之中。为在空间任意点以任意方式操作一个物体,机器人臂需要有6个自由度:左/右、前/后、上/下、投、卷和左右摆转。在工业中使用的坐标已有6个:圆柱形、球形、笛卡尔坐标、旋转坐标、Scaratype和并行坐标。

3示教:所谓示教是指操作者在实际作业环境中,或用手工引导机器人末端执行器,或用手工引导一个机械模拟装置,或用示教盒对机器人进行编程,来操作机器人完成规定作业的所需位姿,并记录下示教点的位姿数据,其间一组连续的示教点就构成了机器人完成相关动作的工作点位,依此构建的程序能够保证机器人在此后的运行中圆满再现人们示教给机器人的作业动作。其实质是机器人将整个作业内容一步一步地记录下来,每一步操作都表示为指令。示教结束后机器人按指令顺序完成示教内容的动作(即再现。)若任务或环境有了改变,要重新进行示教。

4示教学习分类:示教学习的主要目标是通过学习示教者的行为,达到由自主体自动学习最优策略的目的。

直接示教学习:直接学习从状态到动作的映射函数。

直接示教学习的缺点:

直接示教学习的学习目标是状态到动作的映射,而不关注世界环境的建模。因此,学习结果难于解释,也难于调整;

第二、如果环境改变,算法需要重新对所有训练样本进行训练,这将导致大量的重复工作;

第三、在一些应用中,示教者与学习者拥有不同的传感器与能动器。因此,示教者的动作无法直接应用于学习者上。

间接示教学习:先通过观察示教者行为来学习环境参数,再由最优化控制器根据环境参数得到最优策略的过程。

间接示教学习被分为两个阶段:第一个阶段中自主体先学习环境参数(估计环境参数);第二个阶段中自主体再推导当前环境中的最优策略(求解最优控制器)。其中在第一个阶段的若干种环境参数表达方法中,回报函数以良好的泛化能力和对任务的描述能力被广泛采用。直接示教学习

5示教学习的国内外研究现状

随着机器人技术的发展,现代机器人在工业生产、军事发展、科学探索和社会生活等方面得到了广泛应用。机器人学的主要研究目标之一是让机器人可以按照人类预设的策略(状态到动作的映射)去执行动作。在这样的背景下,示教学习(Imitationglearning,Demonstrationlearning,Learningfromdemonstration,LearningbyobservationorApprenticeshiplearning)应运而生。其主要目标是通过学习示教者的行为,达到由自主体自动学习最优策略的目的。早在上个世纪80年代,国外研究者就开始对示教学习进行初步地探讨。示教学习可以分为两类:直接示教学习和间接示教学习。前者直接示教学习从状态到动作的映射函数,后者分为两个阶段:第一个阶段中自主体先学习环境参数;第二个阶段中自主体再推导当前环境中的最优策略。直接示教学习曾在机器人学的发展过程中起到巨大的推动作用,其比较成功的例子诸如ALVINN系统。ALVINN的开发者通过训练神经网络来得到基于前方影像图片对应车辆转向角的预测值。这类方案虽然理论上可行,但在实际应用中往往效果不佳。原因是直接示教学习系统往往倾向于“短视”性规划,即假设最优动作根据当前的单个状态就能够得到。但是,在当前的大多数机器人系统中,这种假设并不成立。事实上,要达到好的学习结果,往往需要考虑几步甚至无穷步后的结果对自主体的影响。与直接示教学习不同,间接示教学习是指先通过观察示教者行为来学习环境参数,

文档评论(0)

素珍 + 关注
实名认证
内容提供者

好文件大家都可以分享

1亿VIP精品文档

相关文档