- 1、本文档共293页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
逆向归纳法与子搏弈精练纳什均衡的存在问题如果n很大,结果又如何呢?1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……多个参与人的情况(2,…,2)如果n很大对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。这个链越长,共同知识的要求就越难满足。第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,0)A2D(0,2)A2D(N,0)A(0,N+1)A1D(0,N-1)A逆向归纳法的结果:一开始,就结束!1D(3,0)A2D(0,4)A每个参与人有多个行动机会的蜈蚣博弈…1.2进行游戏决策,如果1在第一轮决策,得1,2得0,否则进入第二轮,2决策得2,A得0……逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A?2D(0,3)A1D(98,98)A2D(98,101)A…另一种蜈蚣博弈(100,100)2D(97,100)A1D(99,99)A有两个参与人1.2,若第一次1决策结束,1.2都得n,若2决策结束,1得n-1,B得n+2,下一轮从1.1都是n+1开始,共100次,每个参与人有100个决策结。逆向归纳法的结果:一开始,就结束!1D(2,2)A2D(1,4)A但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于应该依赖于你的参与人未来的行为。特别是,你如何修正你队参与人理性程度的评价。逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。他们认为,任何一个有关博弈行为的理论应该是“完备的”,即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博弈行为的条件预测总是很好定义的。泽尔藤将偏离行为解释为参与人在博弈过程中犯的错误,或者说均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能,如果参与人在每个信息集上犯错误的概率是独立的(因而参与人不会犯系统性的错误),那么,不论过去的行为与逆向归纳法的预测如何不同,参与人应该继续使用逆向归纳法预测从现在开始子博弈的行为。第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四重复博弈有限次重复博弈无限次重复博弈参与人不固定时的重复博弈五应用举例重复博弈一次动态博弈也称为“序贯博弈”。重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如囚徒困境。重复博弈的特征:1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构;2、所有参与人都观测到博弈过去的历史;3.参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。贴现因子:下一期的一单位支付在这一期的价值。注意:在每个阶段,参与人可同时行动,也可不同时行动。重复博弈因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。
文档评论(0)