第6.4讲:RepeatedGames(IV):以“三价博弈”为例.ppt

第6.4讲:RepeatedGames(IV):以“三价博弈”为例.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6.4讲:RepeatedGames(IV):以“三价博弈”为例概要

三价博弈的两次重复博弈(续) 总结: * 子博弈完美纳什均衡路径 两次重复博弈实现的总得益组合 1:{(M,M),(M,M)} (3+3δ,3+3δ) 2:{(L,L),(M,M)} (1+3δ,1+3δ) 3:{(M,M),(L,L)} (3+δ,3+δ) 4:{(L,L),(L,L)} (1+δ,1+δ) 5:触发策略实现的博弈路径 (5+3δ,5+3δ) 三价博弈的两次重复博弈(续) 触发策略: 博弈方1:第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 博弈方2:同博弈方1。 * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 三价博弈的两次重复博弈(续) 触发策略实现的可能博弈路径 {(H,H) , (M,M)} {非(H,H)策略组合 , (L,L)} * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 三价博弈的两次重复博弈(续) 当δ1/2时,触发策略实现的博弈路径必为{(H,H), (M,M)}, 是一个子博弈完美纳什均衡。 首先,考察最后一个阶段(即第二次重复)的博弈结果。 触发策略实现的可能博弈路径为 {(H,H), (M,M)}或{非(H,H)策略组合, (L,L)}。 也就是说,在触发策略组合下,第二次重复的博弈结果不外乎是(M,M)或(L,L)。这两种博弈结果都是纳什均衡! * 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 三价博弈的两次重复博弈(续) 其次,考察倒数第二阶段(即第一次重复)的博弈结果。 基于对第二次重复的博弈结果分析,得到两博弈方在第一次重复博弈时的得益矩阵。利用划线法不难发现(M,M)和(L,L)均为纳什均衡。 * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 为使得(H,H)为纳什均衡,那么需要: * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 很显然,当δ1/2时,5+3δ6+δ3+δ1+δ 。 所以,当δ1/2时,纳什均衡(H,H)实现的是两博弈方的最佳得益,因此两博弈方必然会采用它! * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 总结: * 子博弈完美纳什均衡路径 两次重复博弈实现的总得益组合 1:{(M,M),(M,M)} (3+3δ,3+3δ) 2:{(L,L),(M,M)} (1+3δ,1+3δ) 3:{(M,M),(L,L)} (3+δ,3+δ) 4:{(L,L),(L,L)} (1+δ,1+δ) 5:触发策略实现的{(H,H), (M,M)}, (5+3δ,5+3δ) 三价博弈的两次重复博弈(续) ?当δ1/2时,策略组合5(触发策略)为什么能够实现较有效的总得益组合呢 原因在于它具有“报复机制”。 * 三价博弈的两次重复博弈(续) 在触发策略下,在第一个重复阶段,给定博弈方2选择H,如果博弈方1不选择H,而选择M,得益增加1单位;但这个偏离后果是他在第二阶段的得益将由3单位下降为1单位。这样,如果1(3-1)δ(即δ1/2),博弈方1偏离(H,H)是得不偿失的,他将没有积极性偏离。同理,当δ1/2时,博弈方2也将没有积极性偏离(H,H)。 * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 三价博弈的两次重复博弈(续) 触发策略 触发策略实际上是一种典型的策略。在这类典型策略中,两博

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档