- 1、本文档共86页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最优控制和状态估计7
第一部分、最优控制;采用状态方程表示,令;问题 2:;最优控制问题的一般性提法为;第一章、用变分法求解最优控制问题;泛函 如果满足以下条件时,称为线性泛函:;3、泛函变分的规则;4、泛函的极值;;欧拉方程:;证明:让自变量函数 、 在极值曲线 、 附近发生微小变分 、 ,即; 根据定义,泛函的变分 是 的线性主部,即; J 取极值的必要条件是 等于零。因 是任意的,要使上式中第一项(积分项)为零,必有;二、用变分法求解最优控制问题;引入拉格朗日乘子;(12);将上式改写成;几点说明:;可见(21)式和(18)式相同,(22)式和(19)式相同。因此,(14)式和(17)就是欧拉方程,而(7)式和(15)就是横截条件。;3) 哈密顿函数沿最优轨线随时间的变化率; 即哈密顿函数H 沿最优轨线对时间的全导数等于它对时间的偏导数。记为 则;初始条件;由控制方程;2 末值时刻固定,末端状态固定情况下的最优控制;引入哈密顿函数;令性能指标J 的一次变分等于零,得;例 2 问题 1的系统状态方程为;解 根据能控性判据知,该系统是能控的;3)由伴随方程 ,得到;根据边界条件,确定积分常数,得; 3 末值时刻自由情况下的最优控制;于是;应当注意,末值时刻 自由时, 不等于 ;性能指标取极值时,必有;(40);2)由控制方程 ,得;5)由于 自由, ,得到;第二章、用极小值原理求解最优控制问题;二、 极小值原理;以下就是用极小值原理解前面的问题:;则哈密顿函数H 相对最优控制取极小值,即;三、 二次积分模型的快速控制; 要求在状态方程约束下,寻求满足(55)式的最优控制
,使系统从 转移到 ,同时使J 取极小值。;3)伴随方程为;4)由状态方程可知,当 时,求得;从 到达 的相轨迹只有两条 、 。;当初始状态 位于 : 为 (+1,-1);5)最优性能指标;第三章、 用动态规划法求解最优控制问题;第二个办法:从最后一段开始,向前倒推。当倒推到某一站时,计算该站到终点站的总里程,并选择里程最少的走法。;从该例看出,这种解法有两个特点: 第一,它把一个复杂的问题(即:决定一条路线的选择问题)变成许多个简单的问题(即:每次只决定向上走(p)还是向下走(q)的问题),因此问题的求解变得简单容易了。;二、 最优性原理;一般认为,第k 级决策 与第k 级以及k 以前各级状态 和决策 有关;三、 用动态规划法求解离散系统最优控制问题;例 4 线性定常离散系统的状态方程为;2) 向前倒推一级,即;3) 再向前倒推一级,即;四、 用动态规划法求解连续系统最优控制问题; 如果对于初始时刻 和初始状态 来说, 和 是系统的最优控制和最优轨线。那么,对于 和状态
,它们仍是所研究的系统往后的最优控制和最优轨线。;用类似的处理方法,令;而由中值定理,(76)式右边第一项可以写成;显然有;用动态规划法求解连续系统最优控制问题的步骤:;(86);2)将 代入哈密顿-贝尔曼方程;3)将 代入 的表达式中;第四章、线性二次型最优控制问题;二、 有限时间状态调节器(tf 有限)
;求解这个最优控制问题,可以用极小值原理,也可以用动态规划法。这里用极小值原理来求解。;4)将 代入状态方程得;(91)式可改??成;状态反馈的闭环方程为;例 6 系统状态方程为;其中;三、 无限时间状态调节器(tf ? ?);根据分析,显然当 时,J 取极小值。; 可见,无限时间状态调节器与有限时间最优调节器类似,均可以用状态负反馈构成状态闭环控制。但是反馈增益矩阵是时变的,给工程实践带来不便。;(114)式代入(111)式,得;例 7 线性定常系统的状态方程为;当 时, ;当 时, 。;四、 定常情况下状态调节器的稳定性;将(116)式代入(119)式,并且考虑(115)式,
文档评论(0)