第10章贝叶斯博弈与贝叶斯Nash均衡.ppt

下载文档 降价啦

2
0
约9.76千字
约 144页
2017-06-04 发布于湖北
举报
版权申诉
保障服务

第10章贝叶斯博弈与贝叶斯Nash均衡.ppt

1、本文档共144页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第10章贝叶斯博弈与贝叶斯Nash均衡概要

第十章贝叶斯博弈与贝叶斯Nash均衡主要内容：一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释一、贝叶斯博弈前面两部分我们讨论了完全信息博弈问题，但在现实生活中我们遇到更多的可能是不完全信息博弈问题。例如在“新产品开发”博弈中，企业对市场的需求可能并不清楚；在连锁店博弈中，潜在的进入者可能并不知道连锁店在市场上的盈利情况，等等。将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。例如：“斗鸡博弈” 考察这样的情形：假设参与人可能有这样的两种性格特征(类型)——“强硬”(用s表示)或“软弱”(用w表示)。所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者；而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。显然，当具有不同性格特征的决斗者相遇时，所表现出来的博弈情形是不同的。令U表示冲上去；D表示退下去，则每种情况下博弈情形如下图所示。当参与人都为强硬者时博弈存在两个纯战略Nash均衡—— (U，D)和(D,U)。当参与人1为强硬者参与人2为软弱者时博弈存在唯一的Nash均衡——(U, D)。当参与人1为软弱者参与人2为强硬者时博弈存在唯一的Nash均衡——(D, U)。当参与人都为软弱者时博弈存在唯一的Nash均衡——(D, D)。在“斗鸡博弈”中，虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征，但对对手的性格特征往往不甚了解或了解不全。在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈，但对决斗者来讲，仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。对于“强硬”的参与人1来讲，虽然他看到了上面的战略式博弈，但他不知道对手是“强硬”的还是“软弱”的，所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。同样，“软弱”的参与人1也会面临类似的问题。此时，“斗鸡博弈”就是一个不完全信息博弈问题。对于不完全信息博弈问题，是不可能应用前面两部分介绍的方法进行求解的。这是因为给定参与人1为“强硬”的决斗者，如果对手是“软弱”的，那么博弈就只存在惟一的Nash均衡(U, D)，参与人1有惟一的最优选择“冲上去”；如果对手是“强硬”的，则博弈就会出现两个Nash均衡(U,D)和(D,U)，参与人1的最优选择取决于对手的选择。但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的，因此，此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗，一个是“强硬”的，另一个是“软弱”的。当一个参与人并不知道在与谁博弈时，博弈的规则是没有定义的，如何处理不完全信息？ Harsanyi提出了Harsanyi转换。为了分析，对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者，参与人2可能是“强硬”的也可能是“软弱”的，参与人1不知道但参与人2清楚，而且这一假设为所有的参与人所知道。 Harsanyi转换对于简化的“斗鸡博弈”，Harsanyi转换是这样处理的：在原博弈中引入一个“虚拟”参与人——“自然”(nature，用N表示)，构造一个参与人为两个决斗者和“自然”的三人博弈。 Harsanyi转换 Harsanyi通过引入“虚拟”参与人，将博弈的起始点由x1(或x2)提前至x0 ，从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。考察不完全信息博弈问题参与人的决策用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率，v1(U)和v1(D)分别表示参与人1认为自己选择行动U和D时所能得到的期望收益；用x表示“强硬”的决斗者2选择行动U的概率。当即时，对参与人1来讲，其最优选择是U(即“冲上去”)。由于，所以当即参与人1认为参与人2是“强硬”决斗者的可能性不超过1/2时，就会选择“冲上去”。考察参与人2的选择。用q1表示参与人2关于“参与人1关于‘自然’选择的推断”的推断，即q1表示参与人2认为“参与人1认为参与人2是‘强硬’的”概率。由前面的分析可知：如果，则参与人2认为“U(即‘冲上去’)是参与人1的最优选择”；与此同时，如果，则参与人1的最优选择与参与人2的预测一致。但是，如果而，则参与人1的最优选择就可能与参与人