《人工智能控制技术》_高学辉 习题及解答 .docx

《人工智能控制技术》_高学辉 习题及解答 .docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第一章

什么是人工智能?什么是智能控制?

人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

智能控制是研究怎么样利用机器模仿人脑从事推理规划、设计、思考、学习等思维活动,自动或智能的解决传统认为需要由专家才能处理的复杂问题。

主要的学习算法有哪些?请详细说明各种学习算法。

(1)无监督学习应用于神经网络、智能控制、模式识别等多个方面。神经网络中最典型的无监督学习是Hebb学习,其在神经网络中根据神经元连接间的激活水平调节神经网络的权值,类似于控制系统的开环控制。在模式识别中如果缺乏足够的先验知识,难以人工标注类别,希望通过计算机完成或至少提供一些帮助,因此根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。

(2)监督学习在1960年代的神经网络权值更新算法中就已经提出,有代表性的是学习规则。同样在分类中监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。

学习规则属于监督学习规则,要根据神经元的输出情况指导权值的更新,与无监督的Hebb学习规则相比,其进化方向更加明确,或者说优化目标和当前输出确定了进化方向。

(3)强化学习(ReinforcementLearning,RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习也是神经网络重要的学习规则之一。

强化学习的常见模型是标准的马尔可夫决策过程。强化学习可分为基于模式强化学习和无模式强化学习,或者从另外的角度可以分为主动强化学习和被动强化学习。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略有哪些信誉好的足球投注网站算法和值函数有哪些信誉好的足球投注网站算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习。

控制系统模型有哪些?请详细说明各种控制系统模型。

1.时域下状态方程

微分方程或微分方程组(状态方程)是描述系统动力学或运动规律的基本模型形式,目前绝大多数系统模型都用状态方程描述。研究系统的动力学模型或运动方程的步骤可简要归纳如下:

(1)、分析系统工作原理与结构组成,确定系统的输入量和输出量。

(2)、依据所遵循的科学规律,列写相应的微分方程或微分方程组。

(3)、如有必要,消去中间变量,求出仅含输入输出变量的系统微分方程。

一般来说,大多数的实际系统都存在一定的非线性,但大部分非线性系统的微分方程难以求的解析解,因此将非线性方程线性化对于解决实际问题具有十分重要的意义。进行线性化的主要思想是:在预期工作点(通常是稳定状态点)附近,用通过该点的切线代替近似代替原来的曲线。常用到的数学方法是在该工作点附近进行泰勒级数展开。值得注意的是,并不是所有的非线性微分方程都能线性化,如像继电器特性这种本质非线性系统,在数学上不连续,也就不可导,即不满足泰勒展开条件。线性化的条件有以下两点:

(1)、信号在工作点附近变化微量。

(2)、信号在工作点附近能满足泰勒展开条件。

控制系统的状态方程是时域动态数学模型,求解状态方程可得系统在输入量和初始条件作用下的输出响应。随着计算机技术的进步和发展,很多无法求得解析解的状态方程可以用数值解法通过计算机容易实现。因此,用状态方程描述的时域下的动力学方程或运动方程模型越来越重要。

2.复频域下传递函数模型

拉普拉斯变换法(简称拉氏变换法)求解线性微分方程,是将微分方程的求解转化为代数方程的求解,使计算大为简便,由此引入复频域的数学模型—传递函数。传递函数将系统的输入量、输出量与系统分隔开来,仅仅与系统的结构和参数有关,这样非常便于研究结构或参数变化对系统性能的影响。经典控制理论中广泛应用的频率法和根轨迹法,就是以传递函数为基础建立起来的,传递函数是经典控制理论中最基本和最重要的概念。

线性定常系统的传递函数,定义为零初始条件下,系统输出量的拉氏变换与输入量的拉氏变换之比。

设线性定常系统由下述n阶线性常微分方程描述:

式中是系统的输出量,是系统的输入量,及是与系统结构和参数有关的常数系数。输入输出量的各阶导数在时的值均为零,即零初始条件,则对上式两边分别求拉氏变换,并令,,可得

于是,由定义得系统传递函数为

式中的分母称为系统的特征多项式。传递函数具有以下性质:

(1)、传递函数是经过拉氏变换得

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档