- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2、多阶段决策问题的典型例子: 企业在生产过程中,由于需求是随着时间变化的因素,因此企业为了获得全年最佳经济效益,就要在整个生产过程中逐月或逐季的根据库存和需求决定生产计划。 某种机器,可以在高、低两种负荷下生产。高负荷下生产的产量多,但每生产一个阶段后机器的完好率低;低负荷下生产时的情况则相反。现在需要安排该种机器在多个阶段内的生产,问应该如何决定各阶段中机器的使用,使整个计划期内的总产量最大。 某台设备,例如汽车,刚买来时故障少,耗油低,出车时间长,处理价值和经济效益高。随着使用时间的增加则变为故障多,耗油高,维修费用增加,经济效益差。使用时间愈长,处理价值也愈低。另外,每次更新都要付出更新费用。因此,应当如何决定设备的使用年限,使总的效益最佳。 称可供选择策略的范围,为允许策略集,用P表示。 动态规划方法就是要从允许策略集P中找出最优策略P1n*。 4、策略与子策略。策略是一个决策序列的集合。当k=1时,P1n(S1)={d1(s1),d2(s2),…,dn(sn)}就称为全过程的一个策略,简称策略,简记为P1n(S1). 称Pk,n(Sk)= {dk(sk),dk+1(sk+1),…,dn(sn)}为由第k阶段开始到最后阶段止的一个子策略,简称后部子策略。简记为Pk,n(Sk) 5、状态转移方程。它是确定过程由某一阶段的一个状态到下一阶段另一状态的演变过程,用Sk+1=Tk(Sk,dk)表示。该方程描述了由第k阶段到第k+1阶段的状态转移规律。因此又称其为状态转移函数。 6、阶段指标、指标函数和最优指标函数 (1)衡量某阶段决策效益优劣的数量指标,称为阶段指标,用vk(Sk,dk)表示第k阶段的阶段指标。 在不同的问题中,其含义不同。它可以是距离、利润、成本等。 在引例中,用dk=vk(Sk,dk)表示在第k阶段由点Sk到点Sk+1=dk(Sk)距离。如d2(B3,C1)=6。 (2)用于衡量所选定策略优劣的数量指标,称为指标函数。它是定义在全过程和所有后部子过程上确定的数量函数。记为Vk,n(Sk,Pk,n). Vk,n(Sk,Pk,n)=Vk,n(Sk,dk,Sk+1,…Sn+1) k=1,2,…,n。 构成动态规划模型的指标函数,应具有可分离性,并满足递推关系。 常见的指标函数的形式有: ① ② (3)最优指标函数fk(Sk),表示从第k阶段的状态Sk开始采用最优子策略P*k,n,到第n阶段终止时所得到的指标函数值。 即fk(Sk)=Opt Vk,n(Sk,dk,…Sn+1) 其中Opt是最优化的缩写,可根据题意取max或min。 在引例中,指标函数Vk,n表示在第k阶段由点Sk至终点E的距离。fk(sk)表示第k阶段点Sk到终点E的最短距离。f2(B1)=11表示从第2阶段中的点B1到点E的最短距离。 7、基本方程(递推关系式) 从引例求A到E的最短路的计算过程中可以看出,在求解的各个阶段,我们利用了k阶段与k+1阶段之间的递推关系 一般地,若 则有 若 (二)、动态规划的基本思想与最优化原理 1、基本思想:动态规划方法的关键在于正确地写出基本方程,因此首先必须将问题的过程划分为多个相互联系的多阶段决策过程,恰当地选取状态变量和决策变量及定义最优指标函数,从而把问题化成一族同类型的子问题。然后从边界条件开始,逆过程行进方向,逐段递推寻优。在每个子问题求解时,均利用它前面已求出的子问题的最优化结果依次进行,最后一个子问题所得的最优解,就是整个问题的最优解。 在多阶段决策过程中,动态规划方法是既把当前的一段和未来的各段分开,又把当前效益和未来效益结合起来考虑的一种最优化方法。因此,每阶段决策的选取是从全局来考虑,与该段的最优选择一般是不同的。 动态规划方法的基本思想体现了多阶段性、无后效性、递归性、总体优化性。 2、最优化原理 动态规划方法基于R·Bellman等人提出的最优化原理:“作为整个过程的最优策略具有这样的性质,即无论过去的状态和决策如何,对于先前的决策所形成的状态而言,余下的诸决策必须构成最优策略。”简言之,“一个最优策略的子策略总是最优的”。 但是,最优化原理仅是策略最优性的必要条件,而基本方程是策略最优性的充要条件。由此可见,基本方程是动态规划理论与方法的基础。 动态规划模型的建立与求解 (一)、构成动态规划模型的条件 建立动态规划模型,就是分析问题并建立问题的动态规划基本方程。为此,必须满足以下条件: 1、将问题的过程划分成恰当的阶段; 2、正确选
文档评论(0)