第十一章博弈模型.pptVIP

下载本文档

79
0
约6.38千字
约 41页
2017-02-23 发布于上海
举报
版权申诉

第十一章博弈模型.ppt

1、本文档共41页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第十一章博弈模型

（1）协商解 1 1 将剩余获利平均分配模型以n-1方合作的获利为下限求解 ~ xi 的下限（2）纳什均衡解为现状点（谈判时的威慑点）在此基础上“均匀地”分配全体合作的获利B 模型平均分配获利B 2）Nash解 ? 1）协商解只知全体合作的获利B和各自谈判底线（3）最小距离解模型第i 方的边际效益若令 3）最小距离解 ? 1）协商解（4）满意解 di~现状点(最低点) ei~理想点(最高点) 模型 4）基于满意度的解? 1）协商解（5）Raiffi 解与协商解x=(5,4,2)比较求解合作对策的6种方法（可分为三类） Shapley合作对策 A类 B类协商解 Nash解最小距离解满意解 di~现状, ei~理想 B类4种方法相同例：有一资方(甲)和二劳方(乙,丙), 仅当资方与至少一劳方合作时才获利10元，应如何分配该获利？ Raiffi解 C类 B类：计算简单，便于理解，可用于各方实力相差不大的情况；一般来说它偏袒强者. C类：考虑了分配的上下限，又吸取了Shapley的思想，在一定程度上保护弱者. A类：公正合理；需要信息多，计算复杂. 求解合作对策的三类方法小结一句话小结共赢是合作的前提。提出方案之前先要确定原则(公理)。一些局部看起来合理的方案，事实上可能是违反原则的。习题 P412ex11 补充题：用协商解和纳什均衡解方法讨论P392“污水处理费用”问题 * 第十一章博弈模型 11.1 进攻与撤退的抉择（非合作对策） 11.5 效益的合理分配（合作对策）对策论(博弈论)简介例1：孙膑：田忌赛马战国时期齐王欲与大将田忌赛马，双方约定每人挑选上、中、下三个等级的马各一匹进行比赛，每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹，似乎必胜无疑。田忌的朋友给他出了一个主意，让他用下等马比齐王的上等马，上等马对齐王的中等马，中等马对齐王的下等马，结果田忌二胜一败，反而赢了一千金。对策论(博弈论)简介嫌疑犯B 供认不供认嫌疑犯A 供认不供认（2，2）（5，0）（0，5）（0.5，0.5）例2：囚徒困境注：囚徒被分离审查，无法串供最终会出现什么结局？（5,0）表示(A,B)所判刑期囚徒困境假设每个囚徒都是聪明的，会发现如果对方拒供，则自己供认便可立即获得释放，而自己拒供则会被判0.5年，因此供认是较好的选择。如果对方供认，则自己供认将被判2年，而自己拒供则会被判5年，因此供认是较好的选择。由于每个囚徒都发现供认是自己更好的选择，因此，博弈的稳定结果是两个囚徒都会选择供认(2,2)。这就是博弈的纳什均衡。攻守同盟(0.5,0.5)？很难达成：隔离审查，每个人都担心对方背弃盟约。占优均衡与纳什均衡 ⑴ 上策（占优）均衡是指不管你选择什么策略，我所选择的是最好的；不管我选择什么策略，你所选择的是最好的。 ⑵ 纳什均衡是指给定你的策略，我所选择的是最好的；给定我的策略，你所选择的是最好的。所谓均衡是指一种稳定的结局，当这种结局出现的时候，所有的对局者都不想再改变他们所选择的策略。两个囚徒都会选择供认，不仅是纳什均衡，也是占优均衡。单一决策主体决策变量目标函数约束条件决策主体的决策行为发生直接相互作用 (相互影响) 博弈模型非合作博弈合作博弈三要素博弈模型 (Game Theory) 多个决策主体优化模型 (Optimization) 决策问题（Decision Problem）静态、动态信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛诺曼底战役(1944.6.6-8.25)是目前为止世界上最大的两栖登陆作战。美英军队开辟第二战场，重返欧洲大陆，使第二次世界大战的战略态势发生了根本性变化。 1944年6月初，盟军在诺曼底登陆成功. 到8月初的形势：背景 11.1 进攻与撤退的抉择双方应该如何决策？强化缺口盟军 (预备队) 撤退进攻德军盟军(加) 盟军(英) 盟军(美一) 盟军(美三) 东进原地待命盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军模型假设博弈参与者为两方（盟军和德军）盟军有3种使用其预备队的行动：强化缺口，原地待命，东进；德军有2种行动：向西进攻或向东撤退. 博弈双方完全理性，目的都是使战斗中己方获得的净胜场次（胜利场次减去失败场次）尽可能多. 盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军完全信息静