- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论及应用4
第四章 重复博弈 重复博弈:基本博弈(完全信息静态博弈,完全信息动态博弈)重复进行构成的博弈过程。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。 本章分三节 4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈 4.1 重复博弈引论一、为何研究重复博弈 经济中的长期关系 例如 (1)两家企业在一个市场上的长期竞争, (2)市场营销中的回头客问题, (3) 买卖问题。 (4)信任、信誉、声誉问题 人们的预见性。 由于人的思维的限制,在短期行为中缺乏默契或合作的关系,但在长期中这样的机会就大得多。即是未来利益对当前行为的制约 二、重复博弈的分类 1、有限次重复博弈:给定一个基本博弈G(可以 是静态博弈,也可以是动态博弈),重复进行T 次G,并且在每次重复G之前各博弈方都能观察到 以前博弈的结果,这样的博弈过程称为“G的T次 重复博弈”,记为G(T)。而G则称为G(T)的“原 博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。 二、重复博弈的分类(Cont..) 2、无限次重复博弈:一个基本博弈G一直重复博 弈下去的博弈,记为G( ). 注:1、无法验证某个重复博弈会一直重复下去。 2、如果主观上认为博弈会不断进行下去,那么博弈就可无限次重复下去。 3、随机结束的重复博弈:重复的次数和结束的 时间不确定的重复博弈。 三、策略、子博弈和均衡路径 策略:博弈方在每个阶段针对每种情况如何行为的计划。 子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分。 因此:动态博弈的分析方法都可用于重复博弈。 均衡路径:由每个阶段博弈方的行为组合串联而成。 四、重复博弈的得益 重复博弈的博一方的行为、策略选择不能只 考虑本阶段的得益,必须兼顾其它阶段的得益、 或考虑整个重复博弈过程得益的总体情况。 计算有限次重复博弈的总体得益方法之一: 计算重复博弈的“总得益”——博弈方各次重复得益的总和。 计算有限次重复博弈的总体得益方法之二: 计算各阶段的平均得益 四、重复博弈的得益(Cont…) 如果重复的时间很长,就应考虑资金的时间价 值,此时考虑贴现系数 重复T期的重复博弈总得益为: 重复无限期的重复博弈总得益为: 四、重复博弈的得益(Cont…) 4.2 有限次重复博弈 4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理 4.2.1 两人零和博弈的有限次重复博弈 零和博弈和严格竞争博弈,每次重复博弈并不改变这 一点。也就是说每次博弈得益都是对立的,于是重复博 弈不回创造新的利益。 例如:猜硬币博弈。 零和博弈采用逆向归纳法分析有如下结论: 以零和博弈为原博弈的有限次重复博弈中,所有博弈 方的唯一选择策略是重复一次性博弈中的纳什均衡策略 (混合策略纳什均衡)。 原因:重复不会改变博弈效率是利益是对立的不可调和的。 4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈 唯一的Nash均衡有两种: 一是:本身是帕雷托最优的。它都符合双方的利益, 重复不会改变 二是:本身不是帕雷托最优的。重复能否改变得益? 一、有限次重复囚徒的困境博弈 二、一般结论 定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。 三、有限次重复寡头削价竞争博弈 四、重复囚徒困境悖论和连锁店悖论 有惟一纯策略Nash均衡的有限次重复博弈的分 析和定理是强烈的,但这与人们的直觉经验有矛 盾,大量的实验研究表明,其结果与理论结果也 不一样。 1978年,塞尔顿提出的“连锁店悖论” 在n个市场(例如n个城市)都开设有连锁店的企业, 对各个市场的竞争者是否应该打击的策略选择? “连锁店悖论” 由于竞争者不会同时进入,于是和每一个城市 的竞争者博弈,就可看成n次重复博弈。而每一 次博弈就是“先来后到”博弈,则竞争者进入,在 位者不打击是唯一的Nash均衡。于是重复博弈的 子博弈Nash均衡就是…… 但只要………….. 囚徒困境重复博弈的症结是
文档评论(0)