第五章 重复博弈课件.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 重复博弈课件

第五章 重复博弈;经济社会中除了短期一次性关系,还存在许多长期反复的合作和竞争关系。如两家企业在一个市场上的长期竞争,商业中的回头客问题等。 长期关系与短期关系之间的差别并不只是时间跨度长短的数量问题,而是有重要的性质差别。短期关系中缺乏形成某种合作关系,或者通过报复、制裁的威胁相互约束行为,追求共同利益的机会,而在长期关系中这样的机会就大得多。长期关系中在考虑当前利益的同时需要兼顾未来收益。;几个例子;破解困局;道德或法律?;湖北“捞尸索钱门” ;富二代“飙车门” ;豆饼老太“拾金不昧被告门” ;如何提高合作呢?;谈恋爱;第一节 重复博弈的定义及扩展式;其中 称为贴现因子(Discount factor)。 我们考虑一个随机结束重复博弈,即进行一个重复博弈时,每次都通过抽签来决定是否停止重复,如果抽到停止的概率为P,则抽到重复下去的概率为1-P。设某博弈方在下一阶段的博弈中得到的收益为R1, 利率为r,因为继续博弈的概率为1-P,么在当前阶段硬币未抛之前的价值(即贴现后的期望值)为(1 – p)R1/(1+ r);如果下两阶段能得到的收益为R2,在当前阶段硬币未抛之前的价值为(1 – p)2R2/(1+ r)2;下三阶段、四阶段等等的收益,照此类推。 令 ,则贴现因子既包含了货币的时间价值(贴现率1/(1+r)),又包含了博弈结束的可能性(1 – p)。 ;其中Rmax = max{R1, R2, R3, …},即Rmax为收益流中的最大值。同理,;定义5.1 设贴现因子为 ,收益流(R1, R2, R3, …)的贴现平均收益值为;它实际上为阶段博弈G的收益函数u(s)的一个贴现和,我们把u(s)也称为伯努利收益函数,因为它也像v-N-M偏好一样,要求u(s)必须满足线形变换,即只有当f = a + bu(s),b0时,f 和u才表示相同的重复博弈偏好。因为这时的v实际上是预期收益函数。 ;二、重复博弈的定义及扩展式;其中 为伯努利收益函数, 为重复博弈t阶段的行动组合(T t 1),为贴现因子,Ri为参与者i的贴现平均收益值,等于 ;为了更为形象,我们引入一个重复信用困境博弈,其阶段博弈G的博弈矩阵如图5-1所示。;实际上,运用逆推法,很容易证明,只要重复博弈进行的次数是有限的,那么(欺骗,欺骗)这样的结果会在每一个阶段博弈中出现。上述的直观认识具有普遍意义。如果阶段博弈G存在唯一纳什均衡,那么G(T)的子博弈完美均衡不过是纳什均衡重复T次,根本的原因是,如果最后一个子博弈G(1)存在唯一的纳什均衡,那么无论前面的历史如何都不会改变最后一个子博弈的均衡结果(反正过去的已经成为过去),因而G(T)的完美均衡不过是G的纳什均衡重复T次,这就有了命题5.1。 命题5.1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈完美均衡:即G的纳什均衡结果在每一个阶段重复进行。 利用命题5.1可知,无论信用困境重复多少次,只要不是无穷的,那么唯一的均衡结果只能是每一阶段都为(欺骗,欺骗),因而人类社会所谓的合作根本就不可能产生,人与人之间的诚信只能是一种奢望。然而,现实并非如此,虽然人与人之间存在着利益冲突,但也确实存在着合作的行动和结果。那么如何破解囚徒困境的诅咒呢? ;二、多重均衡的有限重复博弈;与原信用困境一个重要的不同是合作解有可能成为子博弈完美均衡解在重复博弈中出现。 在证明之前,请同学们想一想(逆推法)。 我们首先从信用困境1的第二阶段开始。在第二阶段,(欺骗,欺骗)和(中,中)都是阶段博弈G的纳什均衡,因而“策略组合”[(如果对手诚信,选择中;如果非诚信,选择欺骗),(如果对手诚信,选择中;如果非诚信,选择欺骗)]是子博弈G(1)的一个纳什均衡。把这一均衡策略下对应的收益代入第一阶段,就得到图5-4。;在图5-4中显然存在着3个纯纳什均衡:(欺骗,欺骗)、(中,中)和(诚信,诚信)。根据逆推法,这3个纯纳什均衡都是信用困境1重复博弈的子博弈完美均衡解。前两个完美均衡都简单地由两个阶段博弈的纳什均衡组成,但第三个纳什均衡结果却由一个非纳什均衡(第一阶段)和一个纳什均衡(第二阶段)组成。它对应着的子博弈完美均衡结果为[(诚信,诚信),(中,中)],与前两个完美均衡本质不同的地方是合作解(诚信,诚信)在第一阶段中出现了。实际上,如果G是一个有着多重纳什均衡的完全信息静态博弈,则重复博弈G(T)就可能存在子博弈完美均衡解,其中对每一个tT,第t阶段的结果都不是G的纳什均衡。这就从一个方面揭示了为什么合作解能够在重复博弈中出现,因为合作得到奖励,不合作受到惩罚,因

文档评论(0)

baa89089 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档