- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 混合策略纳什均衡问题举例 例2、局中人是政府和一个流浪汉,流浪汉有两个策略:寻找工作或游荡;政府也有两个策略:救济或不救济。政府帮助流浪汉的前提是后者必须试图寻找工作;否则,前者不予帮助;而流浪汉只有在得不到救济时才会寻找工作。下表给出了对策的赢得双矩阵: 流浪汉 政府 ?1(寻找工作) ?2(游荡) ?1 (救济) (3,2) (-1,3) ?2 (不救济) (-1,1) (0,0) 因此,在这个对策问题中,没有一个纯局势可以构成纯策略下的纳什均衡。为求得纳什均衡,必须对矩阵加以扩充。 * 设A,B分别为局中人1和2的赢得矩阵,且皆为m?n矩阵,局中人1,2的混合策略集为: 如果一个混合策略组合(X*,Y*)同时满足 则称策略组合——局势( X*,Y*)是一个混合策略纳什均衡。 混合策略纳什均衡问题一般模型 * 对于上述例题,假定政府以概率x选择救济,以概率1-x选择不救济,即政府的混合策略为(x,1-x),流浪汉以概率y选择寻找工作,以概率1-y选择游荡,即流浪汉的混合策略为(y,1-y)。那么政府的期望赢得函数为: 用微分求极值的方法: 这就是说,在混合策略中,流浪汉在对付给定政府的混合策略下,最优策略是以1/5的概率选择寻找工作,4/5的概率选择游荡,即Y*=(1/5,4/5) * 同样流浪汉的期望赢得函数为: 用微分极值法求: 即在混合策略均衡中,政府在对付给定流浪汉的混合策略下,最优策略是X*=(1/2,1/2)。 由于纳什均衡要求每个局中人的混合策略是在给定对方的混合策略下的最优选择,因此,由x*=(1/2,1/2)和Y*=(1/5,4/5)构成的(x*,Y*)是唯一的纳什均衡。且此时赢得函数值为:EA(X,Y)=-1/5, EB(X,Y)=3/2。 * P310例——种菜 P310 自然 人 β1 β2 β3 β4 β5 β6 α1 192460 235120 278200 156360 197520 242840 α2 189560 231700 273630 155620 195600 239710 α3 192060 234799 277095 158235 198580 243280 α4 194370 237218 280751 158475 199813 245362 α5 194360 238990 281385 157835 199750 246020 * 3、问题举例 例1、采购问题 局中人—采购员和气候 策略—气候:偏暖、正常、偏冷;采购员:秋天购煤1000、1500、2000吨 支付函数—秋天购买价格为200元/吨,冬天再购买价格是300元/吨。 -20万 -35万 -50万 -30万 -30万 -45万 -40万 -40万 -40万 气候 偏暖 正常 偏冷 1000 采购员 1500 2000 ——两人、有限、非合作、零和对策 * 例2、甲、已两企业生产同一种电子产品,两企业都想通过改革措施争取更多的市场份额。 甲企业的措施有:(1)降价;(2)提高产品质量,处长保修期;(3)推出新产品。 乙企业的措施有:(1)增加广告费用;(2)增设维修点;(3)改进产品性能。 假定市场份额 一定且通过预测可 知,两企业的市场 占有变动如表。试 通过对策分析,确 定两个企业各自的 最优策略。 乙 甲 1 2 3 1 10 -1 3 2 12 10 -5 3 6 8 5 * 例3、一个病人的症状说明他可能患a、b、c三种病中的一种,有两种药A与B可用。A的治愈率为0.5,0.4,0.6;B的治愈率为0.7,0.1,0.8。问医生应开哪种药才能最稳妥? 病人 医生 a b c A 0.5 0.4 0.6 B 0.7 0.1 0.8 * 例4、甲、乙两队进行乒乓球团体赛,每队都由三名球员组成。双方可排出三种不同的阵容,每一种阵容可以看成一种策略, 根据以往的比赛记录,相应的支付矩阵为 ,那么这次比赛双方各采用哪种阵容上场最稳妥? * 4、具有混合策略的矩阵对策 该矩阵对策在纯策略下无解。此时,用最大最小原则来选取各自的纯策略都不会是稳定的,因为各局中人可以选取其它的纯策略来改善自己的赢得值。 * 在上述双方都不能固定采用任何一个纯策略下,必须随机地选取自己的各个纯策略,使双方捉摸不到自己使用的策略,以求得自己的期望赢得最大(或期望损失
文档评论(0)