- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * 将上述结果代入 的表达式,得到 再利用 可得 把它代入 ,可得 * 继续利用动态规划基本方程式,可得 和 利用初始条件x(0)=1和系统方程,经过迭代计算,可得最优控制和最优轨线: * 例 状态方程为 满足 求 使 解 * * 例 t1可动,求反馈控制使 取极小(其中r 0,r 为常数)。 解 哈密顿函数 HJB方程 哈密顿函数取极值 * 对于不显含时间 t 的定常系统,当末端时间tf自由时,最优值函数V[x(t),t]只与初始状态有关而不显含时间 t,则 故反馈控制为 * 例 t1给定,u使 取极小,试写出最优值函数 所满足的方程。 解 哈密顿函数 哈密顿函数取极值 * 解此偏微分方程相当困难。事实上,除了线性二次型最优控制之外,很少能求得动态规划基本方程的解析解。 利用动态规划基本方程得到的非线性偏微分方程,通常需要借助于计算机进行数值求解,或利用最优值函数的级数展开式进行近似求解。 HJB方程 即为所求的方程。 * 例 给定2阶系统 及性能指标 求最优控制u*,使J取最小值。 解 本题中 , , , , 显然系统是完全能控与完全能观测的。 * , , , , 先解黎卡提方程,设 则有 经简单的矩阵运算可得 , , * 解之,得 , , 故最优控制为 闭环系统矩阵 故闭环极点为 这表明闭环系统是渐近稳定的。 , , * * 最优控制问题,实质上是一种具有特定区域限制和微分方程约束及其它约束条件的泛函的条件极值问题。 * * * * * * * * * * * * * * * * * * * * 考虑系统: 性能指标 J的下标N表示由u (0) 到u (N-1)控制N步。问题的提法是:求控制序列u*(0),u*(1), u*(2),…, u*(N-1)使JN取极大(或极小)。 离散动态规划基本递推方程 且 在解离散系统最优控制问题时,应用离散动态规划基本递推方程,可以由最后一步开始,把一个N步控制问题化为N个一步控制的问题。 * 连续动态规划 哈米尔登—雅可比—贝尔曼方程(HJB方程) 非线性系统 性能指标 式中端点时间t0、tf固定,终端状态x(tf)未规定。我们的任务是从容许控制的集合中求出最优控制u*(t),使性能指标J 取极小。 则相应的边界条件为 或 * 习题 1、下图为城市交通线路(网络),x0为始发站,求经过中间的三个车站到达终点的三个车站中的任何一个的线路所用的时间最小,并标出最优值函数 。 7 7 8 x0 3 4 6 6 3 3 2 4 4 5 2、 取最小值。 * 3、 取最小值。 4、 ,t1给定,q,r均为常数,使 取最小值。试证最优值函数 满足方程 令 时,试证p(t)满足 ,p(t1)=0 当 * 线性最优控制 其中x(t)为n维状态向量,u(t)为m维控制向量,y(t)为p维输出向量;A(t),B(t),C(t)分别为n×n,n×m,和p×n维矩阵,它们是时间的分段连续函数。求出一控制u(t),使如下性能指标取极小值 给定线性系统的状态方程与输出方程 令e(t)=x(t),则问题化为:用尽可能小的控制能量,使状态x(t)保持在零值附近,因而称之为状态调节器问题。 令e(t)=y(t),则问题归结为:用尽可能小的控制能量,使输出y(t)保持在零值附近,因而称之为输出调节器问题。 令e(t)=yr(t)- y(t),其中yr(t)是系统的理想输出,则问题归结为:用尽可能小的控制能量,使输出跟踪yr(t)的变化,因而称之为跟踪问题。 * 状态调节器 系统状态方程 性能指标 其中t0和tf固定;F是半正定对称定常矩阵;Q(t)是半正定对称时变矩阵;R(t)是正定对称时变矩阵。 最优控制律 且性能指标的最小值为 黎卡提(Riccati)矩阵(P(t)是对称非负定时变矩阵)微分方程 末端约束 P(tf)=F * 输出调节器 性能指标 给定可观测线性时变系统 其中t0和tf固定;F是半正定对称定常矩阵;Q(t)是半正定对称时变矩阵;R(t)是正定对称时变矩阵。 最优控制 矩阵P(t)满足黎卡提(Riccati)微分方程 和边界条件 P(tf)=CT(tf)FC(tf) * 定常调节器 给定完全能控线性定常系统 和性能指标 Q是半正定对称常数矩阵;R是正定对称常数矩阵。 P(正定对称常数矩阵)满足黎卡提(Riccati)线性矩阵代数方程 最优控制 性能指标的最小值为 * 定常调节器的最优闭环系统是渐近稳定的 根据李亚普诺夫稳定性理论,按全状态负反
文档评论(0)