- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第四章重复博弈;重复博弈;本章分三节;4.1重复博弈引论;4.1.1为何研究重复博弈;“冲突”何以能产生合作,就是因为重复博弈的存在;4.1.2基本概念;2.重复博弈的策略、子博弈和均衡路径
(1)重复博弈的策略
重复博弈中每个博弈方在每个阶段都必须进行策略选择,因此博弈方的一个策略就是在每次重复时,针对其前面阶段所有可能的情况如何进行行动的计划。
(2)重复博弈的子博弈
重复博弈的子博弈就是从某个阶段(除第一阶段以外)开始,包括此后所有阶段的重复博弈部分。重复博弈的子博弈要么仍然是重复博弈,只是重复的次数较少,要么就是原博弈。
(3)重复博弈的均衡路径
重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。而且对应前一阶段的每一种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果,如原博弈有m种策略组合,那么重复两次就有m2条博弈路径,重复T次就有mT条博弈路径,因此在重博弈中,博弈方在重复博弈中的策略空间要远远大于在每个阶段博弈中的策略空间,重复博弈的路径数往往是很大的,常常可以产生一些意想不到的均衡路径。;3.重复博弈的得益
方法之一是计算重复博弈的”总得益”,即博弈方各次重复得益的总和;
另一种方法是计算各阶段的“平均得益”,即总得益除以重复次数。;重复博弈的总得益;重复博弈的平均得益;4.2有限次重复博弈;4.2.1两人零和博弈的有限次重复博弈;4.2.2两人零和博弈的无限次重复博弈;4.2.2唯一纯策略纳什均衡博弈的
有限次重复博弈;有限次重复削价竞争博弈;4.4多个纯策略纳什均衡的重复博弈;4.4.1多个纯策略纳什均衡的有限次重复博弈;5,5;在上面的分析中,我们发现触发策略重复是一种非常重要的机制,采用这种策略就意味着对将来策略选择所作的可信的威胁或承诺可以影响到当前阶段的行动选择。但如果仔细分析,不难发现上述触发策略也可能存在值得推敲的问题,就是报复机制的可信性。惩罚别人也惩罚自己!;其实,并不是每个重复博弈的触发策略都有可信性问题,触发策略在很多情况下是非常可信的。;在博弈理论中,有两个著名的策略:
1.触发策??(Triggerstrategies)。
2.“一报还一报”策略:也就是若你采取不合作策略,我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。这叫,或者称为“针锋相对”,英文叫Tit-for-Tat。;一报还一报的策略是这样的:第一次博弈采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。也就是说,一报还一报的策略实行了“胡萝卜加大棒”的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报,哪怕以前这个对手曾经背叛过它,从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“可激怒的”。而且,它的策略极为简单,对手一望便知其用意何在,从这个意义来说它又是“简单明了的”。“一报还一报”策略的优越性向我们充分展示了一个纯粹自利的人何以会选择善,只因为合作是自我利益最大化的一种必要手段。;美国密执安大学的罗伯特·埃克斯罗德(RobertAxerold)曾经主持过一次计算机比赛,看谁写出来的程序能够赢。参加者有政治学家、数学家、经济学家、社会学家,他们都详细研究过囚徒困境。获胜者是加拿大多伦多大学的罗伯布(AnatolRapoport)写的“一报还一报”(Tit-for-Tat)策略。;两市场博弈的重复博弈(重复一次);两市场博弈的重复博弈(重复两次);重复博弈不同策略、均衡及一次性博弈得益比较;重复博弈不同策略、均衡及一次性博弈得益比较;两市场博弈的重复博弈(重复三次);两市场博弈的重复博弈(重复三次);两市场博弈的重复博弈(重复101次);由上面两个重复博弈例子的分析可以看出,当原博弈有多个纯策略纳什均衡时,有限次重复博弈存在许多效率差异很大的子博弈完美纳什均衡,并且可以通过设计包含报复机制的触发策略,来实现效率较高的均衡,得到一次性博弈中无法实现的潜在合作利益。而提高效率和发掘潜在利益可能性和程度,则主要决定于运用特定策略的条件,采用的策略,以及重复博弈的次数。由此,我们得到如下的“无名氏定理”(FolkTheorem)。在阐述“无名氏定理”之前,我们再介绍几个关于得益的概念。;设wi为博弈方i在一次性博弈中最差的均衡得益,用w记各博弈方的wi构成的得益数组。
无论其他博弈方行为如何,一博弈方在某个博弈中自己采取某种特定的策略,能够最低限度保证得到的得益称为“保留得益”(ReservationPayoff)或“个体理性得益”(I
您可能关注的文档
最近下载
- 中国春节申遗成功ppt课件.pptx VIP
- 设备操作工考试试题及答案.docx VIP
- 青少年身体健康知识讲座.pptx
- AP化学 2013年真题 (选择题+问答题) AP Chemistry 2013 Released Exam and Answers (MCQ+FRQ).pdf VIP
- 步步高 HCD007(198)TSD电话 使用说明书.pdf
- 2025-2030年中国医用复合膜行业竞争格局及前景趋势预测报告.docx
- 标准图集-22J403-1 楼梯 栏杆 栏板(一).pdf VIP
- 婚姻登记务与管理.ppt
- SLT 618-2021 水利水电工程可行性研究报告编制规程.docx
- 项目现场生产与进度管控方案.pdf VIP
文档评论(0)