完全信息静态博弈教学课件.ppt

下载文档 降价啦

4
0
约2.48万字
约 152页
2018-02-03 发布于江西
举报
版权申诉
保障服务

完全信息静态博弈教学课件.ppt

1、本文档共152页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 2.6.1 帕累托和风险上策均衡帕累托上策均衡：依据帕累托效率意义上的优劣关系，某一个纳什均衡给所有博弈方带来的利益都大于其他所有纳什均衡会带来的利益，博弈方选择的倾向性是一致的。 -5， -5 -10， 8 8， -10 10， 10 战争和平国家2 战争和平国家 1 战争与和平两个纯策略纳什均衡： (战争,战争), (和平,和平) 在帕累托效率意义上,(和平,和平)明显较好，构成一个帕累托上策均衡。如果两国的决策者都是理性的，那么两个国家之间就不应该会发生战争。 * 2.6.1 帕累托和风险上策均衡风险上策均衡：如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时，都偏爱其中某一纳什均衡，则该纳什均衡就是一个风险上策均衡。 9， 9 8， 0 0， 8 7， 7 L R 博弈方2 U D 博弈方 1 风险上策均衡（D，R）明显地(U,L)为帕累托上策均衡，但是选择这个NE对双方都有很大风险,一旦对方偏离这个均衡，那么自身的得益损失是非常大的，相对于这种高风险，(D,R)就有了相对优势。 * 2.6.1 帕累托和风险上策均衡 ?混合策略纳什均衡。混合策略纳什均衡是博弈方使得对方行为选择无差异时，自身行为的概率分布。博弈方1：令博弈方2选择L与R无差异博弈方2：令博弈方1选择U与D无差异 * 2.6.1 帕累托和风险上策均衡 ?检查博弈方的策略偏好。博弈方1的混合策略（PU和PD）与博弈方2策略L与R的偏好性。当PU 7/8，1- PU =PD1/8时，有 U(L)U(R)，即此时博弈方2对策略R具有偏好。 * 2.6.1 帕累托和风险上策均衡 ?检查博弈方的策略偏好。博弈方2的混合策略（PL和PR）与博弈方1策略U与D的偏好性。当PL 7/8，1- PL =PR1/8时，有 U(U)U(D)，即博弈方2对策略D具有偏好。 * 2.6.1 帕累托和风险上策均衡如果博弈方1倾向于策略D的随机概率大于12.5%，那么博弈方2的R策略相对于帕累托均衡策略L就具有期望得益上的优势，因此博弈方2偏好于R；如果博弈方2倾向于R的随机概率大于12.5%，那么博弈方1的D策略相对于帕累托均衡策略D就具有期望得益上的优势，因此博弈方1偏好于D。 * 2.6.1 帕累托和风险上策均衡总结 ?偏离的概率要求小于1/8(12.5%)才能保证帕累托上策均衡(U,L)可以实现。这比较不保险。 ?一旦对方偏离帕累托上策均衡的概率大于12.5%，如果自己不改变帕累托上策均衡的策略，那么很有可能获得0收益，风险很大。 ?所以，在收益相差不是很大的情况下，(D,R)相对于(U,L)具有风险上的较大优势，(D,R)就是一个风险上策均衡。 ?说白了，一方“不靠谱”使得另一方选择更加保险的策略。 * 2.6.1 帕累托和风险上策均衡猎鹿博弈（详细分析如上例，请同学们自行完成） 5， 5 3， 0 0， 3 3， 3 鹿兔子猎人2 鹿兔子猎人 1 猎鹿博弈风险上策均衡（兔子，兔子）猎鹿有风险捕兔有保障其中一种简单情况：假如另一方选择猎鹿和抓兔的概率都是1/2，那么“猎鹿”的期望收益仅为2.5，小于抓兔子的确定性收益3，因此(兔子,兔子)就是这个博弈的一个风险上策均衡。猎人1猎鹿：猎人2猎鹿： * 2.6.1 帕累托和风险上策均衡博弈方对风险上策均衡的选择倾向，有一种自我强化的机制。当部分或所有博弈方选择风险上策均衡的可能性增强时（都担心对方偏离帕累托上策均衡），任一博弈方选择帕累托上策均衡策略的期望得益都会进一步变小，这就使各博弈方更倾向于选择风险上策均衡，从而形成一种选择风险上策均衡的正反馈机制，使其出现的机会越来越大。合作难，多人合作更难。 * 2.6.2 聚点和相关均衡 1. 聚点均衡人们的决策选择受心理、习惯、文化、环境等多种因素影响。体现出这些因素的纳什均衡，就称为聚点均衡。 * 2.6.2 聚点和相关均衡例1. 报时博弈。（1）博弈参与人：博弈方1、博弈方2；（2）策略：双方选择0点到24点的任意时间报时；(无限) （3）顺序：同时；（4）得益：2人报时间相同，获得100元；报时不同，获得0元。