- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章重复博弈整理ppt
第一节 概述 一、含义 1.含义:同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”(stage game) 阶段博弈既可以是静态博弈,也可以是动态博弈。 “同样结构”的博弈是指相同的局中人集合、相同的可行行为空间或策略空间、相同的效用函数。 若在每一阶段博弈的末期,局中人的行为可被观察到,那么局中人就有可能在对手过去行为的基础上,在下一阶段博弈采取相应的策略,由此可能导致的均衡结局与一次博弈的均衡不同。 2.重复博弈与序贯博弈的区别(123) “序贯博弈”(se-quential game):参与人在前一个阶段的行动选择决定随后的子博弈的结构;从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,也即是,同样结构的子博弈只出现一次。 重复博弈则是同样结构的博弈重复多次。 重复博弈分为有限次重复博弈和无限次重复博弈。 3.重复博弈的基本特征: (1)阶段博弈之间没有“物质上”的联系(no physical links),也就是说,前一阶段的博弈不改变后一阶段博弈的结构(对比之下,序贯博弈涉及物质上的联系); (2)所有参与人都观测到博弈过去的历史(如在每一个新的阶段博弈,两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白); (3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。 由于其他参与人过去行动的历史是观测得到的,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间,从而使重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。这正是分析重复博弈的意义所在。 4.影响重复博弈均衡结果的主要因素是:博弈重复的次数和信息的完备性(com-pleteness)。 重复次数的重要性:来自于参与人在短期利益和长远利益之间的权衡。当博弈只进行一次时,每个参与人只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益从而选择不同的均衡战略。 信息的完备性的重要性:当一个参与人的支付函数(特征)不为其他参与人所知时,该参与人可能有积极性建立一个“好”的声誉(reputation)以换取长远利益。 本节我们只讨论重复次数对均衡结果的影响,有关信息的完备性的影响将在不完全信息动态博弈部分讨论。 二、几个基本概念 1.重复博弈的策略、子博弈和均衡路径 在重复博弈中,博弈方的一个策略就是在每一阶段(即每次重复)针对每种情况(以前阶段的结果)如何行动的计划。 重复博弈的子博弈是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。 动态博弈中各博弈方的策略组合对应一条路径,均衡策略组合对应一条均衡路径,这些路径由各个阶段轮到行动的博弈方的行为依次连接而成。重复博弈的路径即是由每个阶段博弈方的行为组合串联而成的。 2.重复博弈博弈方的得益: 要考虑整个重复博弈过程得益的总体情况。当重复次数较多,每次重复间隔时间又较长时,需考虑得益的时间先后。一般是将每一阶段的得益折算成当前阶段的得益(即现在值)的贴现值。 贴现系数δ=1/(1+γ), γ为以一阶段为期限的市场利率。 方法1:计算重复博弈的“总得益”,即博弈方各次重复博弈的得益的总和; 方法2:计算重复博弈各阶段的“平均得益” 第二节 有限次重复博弈 一、有限次重复博弈的含义 定理:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次,且在每次重复G之前各博弈方都能观测到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T), G称为G(T)的原博弈或阶段博弈, G(T)中的每次重复称为G(T)的一个“阶段”。 二、有限次重复博弈类型 1.两人零和博弈的有限次重复博弈 博弈方的最佳策略都是每一次博弈都重复原博弈的混合策略NE策略。 2.存在唯一纯策略NE博弈的有限次重复博弈 例:有限次重复的囚徒困境博弈 有限次重复削价竞争博弈 连锁店悖论(泽尔腾1978年提出)(124) 定理: 设G是阶段博弈, G(T)是G 重复T次的重复博弈(T∞),那么,如果G有唯一的NE,则重复博弈G(T)的唯一子博弈精炼NE结果是阶段博弈G的NE重复T次,即每个阶段博弈出现的都是一次性博弈的均衡结果。 3.存在多个纯策略NE博弈的有限次重复博弈 (1)存在两个纯战略纳什均衡的有限次重复博弈(课本) 三价博弈 设一市场有两个生产同质产品的厂商,他们对产品的定价有高、中、低三种可能。 设高价时市场总利润为10单位 中价时市场总利润为6单位 低价时市场总利润为2单位。 再假设两厂商同
文档评论(0)