运筹学-动态规划讲述.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第16章 动态规划 动态规划是运筹学的一个分支,它是解决多阶段决策过程最优化的一种数学方法。该方法由美国数学家贝尔曼(R.E.Bellman)等人在20世纪50年代初提出的 §1 多阶段决策问题 多阶段决策问题例子: 例16-1 最短路径问题:求图16-1中从A到F的最短路径。 将问题可分为五个阶段 每个阶段都要作出一个决策,决定向哪个点前进一步。各阶段的决策有机的联系着,本阶段的决策影响着下一阶段的决策,以至于影响整体效果,决策者在做决策时,不应尽考虑本阶段最优,还应考虑对最终目标的影响。各阶段的决策形成一个决策序列,通常称之为一个策略,不同的策略,其效果也不同。现在的问题就是要在允许的策略中,求出A到F的距离最短的策略。 第一阶段:从到A或B; 第二阶段:从B到C; 第三阶段:从C到D; 第四阶段:从D到E; 第五阶段:从E到F; 可将该问题按年划分为五个阶段:第一阶段即第一年;第二阶段即第二年;第三阶段即第三年;第四阶段即第四年;第五阶段即第五年。设开始时完好机器数量为x1 ,第 k年能投入生产的机器数为xk,第 k年高负荷下工作的机器数为 uk 台,效益为 Rk ,则 例16-3部件的生产计划问题:某车间每月底要为下一个月提供出一定数量的部件给组装车间,各月份中生产这种部件所需工时不同,生产出来多余的部件可以存入库中,但库房的最高贮量为H=9,求某6个月中每月生产多少部件,才能使消耗的总工时最少?最小工时是多少?各月的需求量与单位工时如下表: 表7-1 ? 将该问题按月份划分为六个阶段, Sk为第k月开始时的库存, uk为第k 的生产量 。 例16-4 原料分配问题:利用已有的12吨原料制造A、B 两种产品,已知每制造一吨 A产品需要原料4吨,每制造一吨 B 产品需要原料2吨,而两种产品在市场上的价格分别为每吨8千元和1万元,求如何安排生产计划能使总效益最大? 可将分配A、B两产品的产量看作两个阶段:第一阶段:确定生产A产品多少吨;第二阶段:确定生产B产品多少吨。求出使总效益最大的决策序列。 例16-5人员派谴问题:向三个售货区域派谴四名推销员,各区人数及效益如下表: 该问题可按区域分为三个阶段:第一阶段:确定向1区派几名推销员;第二阶段:确定向2区派几名推销员;第三阶段:确定向3区派几名推销员。求出使总效益最大的策略。 问如何派谴人员能使总效益最高? 例16-6货物装载问题:某海轮的总装载能力为 w 千吨(不妨设w=0,1,2, …,18千吨)需装载四种货物,规定海轮上每种货物不超过2件,各种货物的单位重量,单位运费如下表,问怎样装这些货物,才能使总运费最大? 表8-6 §2 动态规划的基本概念与基本原理 2.1?? 动态规划的基本概念 最短路问题中,每个阶段状态表示该阶段初始点的集合。 状态集合用Sk表示, S1={B1,B2} 指标函数应具有可分离性,一般的形式有: 5.指标函数(Return Function) 指标函数(最大收益函数-Maximum Return Function ,或最小成本函数-Minimum Cost Function)是反映策略优劣的一种数量指标,它是一个定义在全过程和所有后部子过程上的函数。 -表示初始状态为s1 采取策略p1,n时全过程的指标函数 -第k阶段状态为sk 采取策略pk,n时后部子过程的指标函数 6.最优策略和最优轨线 称为后部子过程中的最优策略。 称为全过程中的最优策略。 现在结合解决最短路线问题来介绍动态规划方法的基本思想,最短路线有一个重要特性: 如果由起点A经过P点和H点而到达终点G是一条最短路线,则由点P出发经过H点到达终点G的这条子路线,对于从点P出发到达终点的所有可能选择的不同路线来说,必定也是最短路线。 16.2 动态规划的基本定理和基本方程 贝尔曼(R.E.Bellman)最优性原理如下: 作为整个过程的最优策略具有这样的性质: 即无论过去的状态和决策如何,对于先前决策所形成的状态而言,其后的所有决策应构成最优策略。 一般地: 人们逐步认识到: 对于不同类型问题所建立的严格定义的动态规划模型,必须对相应的最优性原理给以必要的验证。即是说,最优性原理不是对任何决策过程都普遍成立的。而且,“最优性原理”与动态规划基本方程并不是无条件等价的,两者之间也不存在确定的蕴含关系。 反映动态规划基本方程的是最优性定理,它是策略最优性的充要条件。 最优性原理仅仅是策略最优性的必要条件,它是最优性定理的推论。 动态规划的基本方程或者最优性定理作为动态规划的理论基础。 动态规划的最优性定理:设阶段数为n的多阶段决策过程,其阶段编号为k=1,…,n,初始状态为s1 ,允许策略 是最优策略

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档