- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4,RepeatedGames汇编
Repeated Games
Repeated Games
Definition:
重复博弈就是某些博弈的多次(两次以上、有限次或无限次)重复进行构成的博弈过程
Why:
重复博弈形式上是基本博弈重复进行,但博弈方的行为和博弈的结果不一定是基本博弈的简单重复进行。不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究
大多数重复博弈都是由静态博弈构成,而重复博弈又是一个动态过程,属于动态博弈的范畴
Function:
重复博弈在现实中有普遍性。社会经济活动中除了一次性关系以外,存在许多长期反复的合作和竞争关系
长期与短期关系之间的差别并不只是时间跨度长短的数量问题,而是有重要的性质差别。长期关系中人们在考虑当前利益的同时需要兼顾未来利益,因此行为的选择和博弈的结果更复杂,可能性也更多
长期关系可以理解成博弈阶段数较多,时间跨度较大的一般动态博弈,社会经济活动中许多长期关系并不相一般动态博弈那样,前一阶段与后一阶段之间有环环相扣的紧密联系,而是各个阶段之间有很强的相互独立性,各个阶段有独立的选择和利益,后面阶段选择的内容和利益形式上并不受前面阶段影响
SORT of Repeated Games
有限次重复博弈:
次数有限
每次重复的条件、规则、内容等都是相同的
得益为一次博弈的累计之和(conditional)
Notice:
重复博弈常常并不是一次博弈的简单重复,因为重复博弈
实现了比一次博弈更有效率的均衡
无限次重复博弈:
次数无限
得益为一个极限值
Notice:
可信性问题仍然对重复博弈的路径、结果产生影响
有限次重复博弈
Definition:
给定一个基本博弈G(可以是静态博弈,特可以是动态博弈),重复进行T次G,并且在每次重复之前各博弈方能观察到以前博弈的结果,这样的博弈过程称为 “G的T次重复博弈”记为G(T)。而G则称为G(T)的“原博弈”。 G(T)中的每次重复称为G(T)的一个“阶段”
Notice:
子博弈。重复博弈的子博弈是从某一阶段(不包括第一阶段)开始,包含此后所有阶段的原重复博弈的一部分,仍然是重复博弈(较少次数)或就是原博弈(正好是最后一阶段时)
策略。某一博弈方的一个策略就是该博弈方在每个阶段(即每次重复)针对每种情况(以前阶段的结果)如何行为的计划
路径。重复博弈中的“路径”是由每个阶段的阶段博弈结果(原博弈的一个策略组合)依次连接而成。重复博弈的路径数为n的T次方。解重复博弈实际上就是要在所有可能的路径中找出具有稳定性的各博弈方都会接受的均衡路径
得益。重复博弈中各博弈方的得益是其每阶段得益相加的“总得益”(无限次重复中要复杂一些);为了进行比较和考察各种重复博弈及其各种均衡的效率,计算“平均得益”;为了体现时间对各博弈方的重要程度的差异,利用“贴现系数”折现得益
有限次重复零和博弈 --猜硬币博弈
Analysis:
由猜硬币博弈作为原博弈构成的重复博弈中,每个博弈方的唯一正确的策略是在每次重复时都采用一次性博弈中所采用的纳什均衡策略,也即各以0.5的概率随机选正面和反面的混合策略。双方每次重复的平均期望得益和期望总得益都为0
Conclusion:
所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重复博弈一样,各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略
再如:齐威王与田忌赛马
有限次重复囚徒的困境博弈(1)
-5,-5
0,-8
-8,0
-1,-1
坦白
不坦白
坦白
不坦白
囚徒
1
囚徒2
囚徒的困境
-10,-10
-5,-13
-13,-5
-6,-6
坦白
坦白
不坦白
不坦白
囚徒2
囚徒
1
两次重复囚徒困境的等价博弈
有限次重复囚徒的困境博弈(2)
Theorem:
设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有唯一的子博弈完美的解,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中的得益的T倍,平均每阶段得益等于原博弈G中的得益
Way:
逆推归纳法
Conclusion:
所有有唯一的纳什均衡策略组合的静态博弈构成的重复博弈问题,与零和博弈一样,都是原博弈的一次性博弈的简单重复和得益相加,除非博弈的条件、环境、规则等有所变化或另有一些在短期中无足轻重,但在长期中却有一定影响力或制约作用的因素存在
石油输出国组织的困境
Analysis:
静态博弈时的纳什均衡
实现的是每个成员国都高产、低价、低利润的均衡
重复博弈时的纳什均衡
各成
文档评论(0)