- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
智能机器人行为能力的获得
Chenghwn(chenghw)
Chenghwn@
1前言
如何让智能机器人具有像人一样的行为能力,正是本文努力讨论的目的,这里讨论的不是技术性的细节问题,而是策略方向,并从理论上证明了这种策略的可行性。本文先讨论了如何设置智能机器人的运动中枢、运动调节中枢、感觉中枢的结构与功能及相互关系(同时也讨论了为什么要这样设置。),然后在此基础上以智能机器人的运动结构在直线与空间中的运动学习为例,讨论了智能机器人是如何通过这些设置的结构与功能来获得像人一样的运动能力的。
2运动中枢、运动调节中枢、感觉中枢
就如人一样,智能机器人的行为应由专门的中枢来控制。
本文对智能机器人控制运动的中枢人的运动皮质及小脑等。每个运动结构(比如一个手指)都有其基本的运动动作(如伸或屈),每个基本的运动动作都对应运动中枢(就如人脑的皮质运动中枢)相应的。这个中枢有联络区能与其它中枢产生兴奋性记忆联系同时存在个运动调节中枢,它能调节每个基本运动的运动所有的基本运动都存在基本调节方式(如减慢运动的调节),每基本调节都对应相应的中枢。这样,每个运动的基本调节都由相应的中枢控制,而且每个运动结构的基本运动在运动的基本调节中枢都应存在相应的结构。它们也存在联络区它们的联络区主要是接受传入,它们的传出主要是控制与调节运动,运动调节中枢和运动中枢的联络区分别与各种感觉中枢的联络区存在广泛的联系,这是运动调节的基础。感觉中枢、运动中枢、调节中枢的记忆柱兴奋到一定强度后都会是中介奖赏刺激,特别是感觉中枢的记忆柱的兴奋。每个运动结构的每特异的运动都会有特异的感受器兴奋,而每特异的运动的产生都应是在运动的过程中相应的基本调节方式调节的结果。这样特异的感觉所兴奋的记忆柱便会与基本调节方式所对应的记忆柱建立记忆联系。它的兴奋便会受到感觉的影响(如平衡觉等等)。这些联络区又能与其它感觉中枢的联络区建立相互兴奋的记忆联系(比如与视觉中枢的联系)。一般情况下,一个运动结构的某一运动状态对应某些基本调节方式所调节的基本运动(当然引起这一运动状态的原因除了调节方式外还有其它方式,比如这一运动状态的起始运动状态),这一运动状态也会对应一群特异的感觉,在共同兴奋的情况下,这些感觉就会与基本调节方式及基本运动建立记忆联系。也会与目的、奖惩建立记忆联系。有了这样的记忆联系,智能机器人就会通过感觉进行奖惩预期,并能过记忆的回忆兴奋相应的基本运动及基本调节方式,而获得预期的运动状态。这样通过与我在论述进行对比会发现,运动状态对应在左或在右的状态,基本运动与基本调节方式都能向那个运动。那么,既然A通过奖惩学习能获得根据目的左或中间或向右的能力,智能机器人也就能通过奖惩学习获得实现某一运动结构的某一运动状态的能力。再通过并行的习惯性兴奋,将多个运动结构的运动状态组合起来就会实现复杂的运动。
3 行为的奖惩学习。
智能机器人的的行为学习就如婴儿的行为学习一样,是逐步发展的,它先获得基本的简单的动作及简单的调节行为的能力,然后在此基础上再获得复杂的有目的的动作行为。在智能机器人早期的动作学习过程中,由于其与环境相适应的一些后天奖惩预期能力还没有形成,因而中介奖惩刺激及相应的奖惩预期发挥着重要的作用。
一、中介奖惩刺激与智能机器人的行为发展
中介奖赏刺激是一种特殊的先天奖惩刺激,它通过编程成为奖惩刺激,感觉中枢的某一原始记忆柱群的兴奋强度在某一范围内便能直接或间接轻微兴奋奖赏中枢,它是中介奖赏刺激。这对智能软件早期的学习非常重要,可以说它是智能机器人早期运动能力学习的主要动力来源。
中介奖赏刺激是智能机器人的追求新奇刺激的最早动力来源,在早期的行为学习过程中起着重要的作用。中介奖赏刺激使智能机器人像婴儿一样不断的重复一些新动作。
智能机器人的行为发展。
才造出的智能机器人不知如何行动,它的行为是通过学习获得的。中介奖赏刺激及其它的奖惩刺激使行为的获得与发展能通过学习自然获得,而不需要专门编程获得。
中介奖赏刺激在基础行为(指抬腿、手等)学习的过程起主要作用。比如,当智能机器人还完全不知如何去控制自己的动作及这一动作可能带来的影响时,其肢体偶然(应与我们的设计有关)进行了某一动作,这个动作在感觉中枢能带来神经的兴奋,兴奋到一定强度便是中介奖惩刺激,它便会不断去追求这一刺激。
随连续的行为发生,一方面与其它兴奋的记忆联系增加(包含视觉感觉等等,通过学习,各种动作逐渐与各种类型的刺激、目的建立了记忆联系。比如在抬腿时,这一动作就与这时所看到的腿的空间位置、抬腿引起的感觉等等多种刺激建立了一定的记忆联系。这便是我后面所述的经验获得的方式之一。),另一方面随熟练度的增加,中介刺激的综合动力急剧下降,从而使实现这一行为不成为主注意目的。这样多次发生后,当动作熟练了,动作刺激相应感觉中枢
文档评论(0)