matlab求动态规划最优解 .pdfVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

matlab求动态规划最优解

求解步骤:

(1)将过程划分为恰当的阶段。

(2)选择状态变量Xk,使它既能描述过程的状态,又满足无后

效性,同时确定允许状态集合Xk。

(3)选择决策变量Uk,确定允许决策集合Uk(Xk)。

(4)写出状态转移方程。

(5)确定阶段指标Vk(xk,Wx)及指标函数Vkn的形式。

(6)写出基本方程即最优值函数满足的递归方程,以及端点条

件。

例题:最短路线问题

阶段按过程的演变划分,状态由各段的初始位置确定,决策为从

各个状态出发的走向,即有Xk+1=Uk(Xk),阶段指标为相邻两段状

态间的距离dk(Xk,Uk(Xk)),指标函数为阶段指标之和,最优值

函数fk(Xk)是由出发Xk到终点的最短距离(或最小费用),基本

方程为:

fk(Xk)=min[dk(Xk,Uk(Xk))+fk+1(Xk+1)],k=n,n-1...,

2,1,fn+1(Xn+1)=0

利用这个模型可以算出例1的最短路线为AB1C2D1E2F2G,相应

的最短距离为18。

动态规划的最优性原理:

无论过去的状态跟决策如何,对前面的决策所形成的状态而言,

后续决策必须构成最优策略。

对于动态规划而言,重要的并不是所谓的模板,比较重要的是在

动态规划中,推导的思维方式。在个人看来动态规划实际就是编程解

决大量数据的决策问题的一种重要编程理念和编程思路。

在动态规划的思路即是反向确立后三次状态改变的两次决策量

的最优决策,确定了该最优决策之后每次反向推导一步,穷举倒数第

三次的不同决策所带来的状态变化量,与之前所得到的的最优决策量

进行加成处理(可能加和也可能相减或相乘相除,具体视情况而定),

将所得后三次决策的总决策量对比选取最优值,作为后四步的最优状

态变化值。先前重复推导,最终得到该问题的最优策略。

文档评论(0)

189****3155 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档