第十一章博弈模型.pptVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章博弈模型

(1)协商解 1 1 将剩余获利 平均分配 模型 以n-1方合作的获利为下限 求解 ~ xi 的下限 (2)纳什均衡解 为现状点(谈判时的威慑点) 在此基础上“均匀地”分配全体合作的获利B 模型 平均分配获利B 2)Nash解 ? 1)协商解 只知全体合作的获利B和各自谈判底线 (3)最小距离解 模型 第i 方的边际效益 若令 3)最小距离解 ? 1)协商解 (4)满意解 di~现状点(最低点) ei~理想点(最高点) 模型 4)基于满意度的解? 1)协商解 (5)Raiffi 解 与协商解x=(5,4,2)比较 求解合作对策的6种方法(可分为三类) Shapley合作对策 A类 B类 协商解 Nash解 最小距离解 满意解 di~现状, ei~理想 B类4种方法相同 例:有一资方(甲)和二劳方(乙,丙), 仅当资方与至少一劳方合作时才获利10元,应如何分配该获利? Raiffi解 C类 B类:计算简单,便于理解,可用于各方实力相差不大的情况;一般来说它偏袒强者. C类: 考虑了分配的上下限,又吸取了Shapley的思想,在一定程度上保护弱者. A类:公正合理;需要信息多,计算复杂. 求解合作对策的三类方法小结 一句话小结 共赢是合作的前提。 提出方案之前先要确定原则(公理)。 一些局部看起来合理的方案,事实上可能是违反原则的。 习题 P412ex11 补充题:用协商解和纳什均衡解方法讨论P392“污水处理费用”问题 * 第十一章 博弈模型 11.1 进攻与撤退的抉择(非合作对策) 11.5 效益的合理分配 (合作对策) 对策论(博弈论)简介 例1:孙膑:田忌赛马 战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。 田忌的朋友给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。 对策论(博弈论)简介 嫌疑犯B 供认 不供认 嫌疑犯A 供认 不供认 (2,2) (5,0) (0,5) (0.5,0.5) 例2:囚徒困境 注:囚徒被分离审查,无法串供 最终会出现什么结局? (5,0)表示(A,B)所判刑期 囚徒困境 假设每个囚徒都是聪明的,会发现 如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。 如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是较好的选择。 由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认(2,2)。这就是博弈的纳什均衡。 攻守同盟(0.5,0.5)? 很难达成:隔离审查,每个人都担心对方背弃盟约。 占优均衡与纳什均衡 ⑴ 上策(占优)均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。 ⑵ 纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。 所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。 两个囚徒都会选择供认,不仅是纳什均衡,也是占优均衡。 单一决策主体 决策变量目标函数约束条件 决策主体的决策行为发生直接相互作用 (相互影响) 博弈模型 非合作博弈 合作博弈 三要素 博弈模型 (Game Theory) 多个决策主体 优化模型 (Optimization) 决策问题(Decision Problem) 静态、动态 信息完全、不完全 军事、政治、经济、企业管理和社会科学中应用广泛 诺曼底战役(1944.6.6-8.25)是目前为止世界上最大的两栖登陆作战。美英军队开辟第二战场,重返欧洲大陆,使第二次世界大战的战略态势发生了根本性变化。 1944年6月初,盟军在诺曼底登陆成功. 到8月初的形势: 背景 11.1 进攻与撤退的抉择 双方应该如何决策 ? 强化缺口 盟军 (预备队) 撤退 进攻 德军 盟军(加) 盟军(英) 盟军(美一) 盟军(美三) 东进 原地 待命 盟军胜1场 盟军败2场 东进 无战斗 盟军胜2场 原地待命 无战斗 盟军胜1场 强化缺口 向东撤退 向西进攻 盟军 德军 模型假设 博弈参与者为两方(盟军和德军) 盟军有3种使用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退. 博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多. 盟军胜1场 盟军败2场 东进 无战斗 盟军胜2场 原地待命 无战斗 盟军胜1场 强化缺口 向东撤退 向西进攻 盟军 德军 完全信息静

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档