第2节最优化原理与动态规划的数学模型.ppt

下载文档 降价啦

5
0
约5.13千字
约 39页
2017-07-03 发布于湖北
举报
版权申诉
保障服务

第2节最优化原理与动态规划的数学模型.ppt

1、本文档共39页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第2节最优化原理与动态规划的数学模型剖析

同理，k=4时有：此时最短路径：相应决策： A B1 B2 C1 C2 C3 D1 D2 D3 E1 E2 F 5 4 4 6 6 5 3 3 3 3 2 4 2 C4 7 5 4 5 1 k=5时，只有一个状态点F，则：此时最短路径： A B1 B2 C1 C2 C3 D1 D2 D3 E1 E2 F 4 4 6 5 3 3 3 2 4 2 C4 7 5 4 5 类似于逆序解法，写出顺序解法的递推方程：这里一般，当初始状态给定时可用逆序解法，当中止状态给定时可用顺序解法。若问题给定了一个初始状态与一个中止状态，则两种方法均可使用。二者并无本质区别。逆序解法与顺序解法的区别： 1.状态转移方式不同： 1 状态s1 决策u1 效益v1(s1,u1) s2 k 状态sk 决策uk 效益vk(sk,uk) sk+1 n 状态sn 决策un 效益vn(sn,un) sn+1 ... ... 状态s1 1 决策u1 效益v1(s2,u1) s2 k 状态sk 决策uk 效益vk(sk+1,uk) sk+1 n 状态sn 决策un 效益vn(sn+1,un) sn+1 ... ... 逆序解法: 顺序解法: 2.指标函数的定义不同：逆序解法中，最优指标函数fk(sk)表示第k阶段从状态sk出发，到终点后部子过程最优效益值，f1(s1)是整体最优函数值顺序解法中，最优指标函数fk(sk+1)表示第k阶段从状态sk+1出发，到起点前部子过程最优效益值，fn(sn+1)是整体最优函数值 3.基本方程形式不同：（1）当指标函数为阶段指标和形式：逆序解法: 基本方程: 顺序解法: 基本方程: （2）当指标函数为阶段指标积形式：逆序解法: 基本方程: 顺序解法: 基本方程: 根据过程演变的特征五、动态规划模型的分类确定性随机性根据状态变量的取值离散型连续型综上，动态规划分为四种类型： ①离散确定型 ②离散随机型 ③连续确定型 ④连续随机型安徽科技学院最优化技术一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素： (1)阶段； (2)状态； (3)决策和策略； (4)状态转移；(5)指标函数第二节最优化原理与动态规划的数学模型以例4为例说明这些概念：二、基本概念一、基本思路将n个阶段的决策问题转化为依次求解n个具有递推关系的单阶段的决策问题，从而简化计算过程。 B A C D E F G 本例中分为k=1,2,3,4,5,6 ，共六个阶段。 (1)阶段将所给问题的过程，按时间或空间特征分解成若干相互联系的阶段，以便按次序去求每个阶段的解，常用字母k表示阶段变量. (2)状态各阶段开始时的客观条件叫做状态。描述各阶段状态的变量称为状态变量，常用sk表示第k阶段的状态变量，状态变量sk的取值集合称为状态集合，用Sk表示。无后效性：当某阶段状态给定以后，在这阶段以后过程的发展不受这段以前的各阶段的影响。即当前的阶段是过去历史的一个完整总结，过程的过去历史只能通过当前状态去影响它未来的发展。状态变量可以是一个数或一个向量。在本例中s2可取B1,B2, 或将Bi定义为i (i=1,2)，则s2=1,2，则 S2={1,2} S1={A} S2={B1,B2} S3={C1,C2,C3,C4} S4={D1,D2,D3} S5={E1,E2,E3} S6={F1,F2} (3)决策和策略当一个阶段的状态确定后，可以作出各种选择从而演变到下一阶段的某个状态，这种选择手段称为决策，在最优控制问题中也称为控制。描述决策的变量称决策变量，变量允许取值的范围称允许决策集合。用uk(sk)表示第 k阶段处于状态sk时的决策变量，它是 sk的函数，用 Dk(sk)表示 sk的允许决策集合。决策变量简称决策。由第k个状态sk开始到终止状态的后部子过程的策略记作类似地，由第k到第j阶段的子过程的策略记作可供选择的策略有一定的范围，称为允许策略集合，用表示决策组成的序列称为策略。由初始状态s1开始的全过程的策略记作在本例中，从第二阶段的状态B1出发，可选择下一段的C1,C2,C3，即允许决策集合为。 D2(B1)={C1,C2,C3} 如果决定选择C3则可表示为： u2 (B1)=C3 表示一个策略 (4)状态转移方程在确定性过程中，一旦某阶段的状态和决策为已知，下阶段的状态便完全确定。用状态转移方程表示这种演变规律，写作本例中状态转移方程： (5)指标函数用于衡量所选定策略优劣的数量指标称为指标函数. 阶段指标函数：指第k阶