- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十广延型博弈与反向归纳策略
第十一讲 广延型博弈与反向归纳策略 广延型博弈适合于分析动态博弈过程,其强调的重点在行动的时序性,以及参与人决定策略时所拥有的信息集。 第一节 广延型博弈的定义与形式 一、广延型博弈的定义 信息完美(perfect information),是指每一个参与人在其作决策时,对于以前所发生的事件具有完全的信息。 广延型博弈构成要素 (1)决策点与决策分枝的结构,在初始决策点与最终结局点之间不存在任何闭环(closedloops); (2)清楚地指明什么决策点属于哪一个参与人; (3)在自然决策点上选择的概率是公共知识; (4)参与人作决策时所依据的信息集;信息集把参与人在某一时刻的所有决策点分成若干类; (5)在博弈的终极点上每一个参与人的收益 二、广延型博弈的形式 广延型博弈是以“决策树”或“博弈树” 的形式来表达的。 三、广延型博弈的规则 第一,初始点没有一条箭头指向它;对其他所有箭头,都只有一条箭头指向它。 第二,如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回这一点,我们只能按反向逐次返回原点。 第二节完美信息广延(动态)博弈 一、特征。 (一)决策有先后顺序 (二)关于博弈进程的信息是不对称的 后决策者拥有更多信息。 (三)具有完美信息: 即参与人决策时完全了解之前的博 弈过程的信息。 (四)动态博弈至少有两个阶段; 阶段: 参与者在某一时点进行的一次决策。 二、可信性: 先决策者对后决策者行为的信任性。 即先决策者是否相信后决策者是否采取 有利的(许诺)或不利的(威胁)行为。 例1:父女博弈。 女儿交了一个父亲不喜欢的男友, 父亲威胁说:“你如果不断绝与他的关系,我与你断绝关系。” 女儿是否相信父亲的威胁?这一博弈可如下表示: 作为女儿,知道父亲断绝与女儿的关系 损失是非常大的, 因此,对父亲来讲,即使女儿不听话,“断 绝”是下策,应被剔除掉: 父亲的威胁是不可信的。 因此,所谓不可信的威胁, 就是指一旦采取该策略, 给他本人带来的收益 并非最大的策略 例2:开金矿(二阶段): 参与人2欲开采一价值4万元的金矿, 但缺乏1万资金,参与人1恰拥有 一万元资金。参与人2对参与人1说: “如果你把钱借给我, 我与你平分开金矿所得。” 参与人1是否应相信2把钱借给他? 参与人2的许诺是不可信的。 所谓不可信的许诺, 就是指一旦采取该策略, 给他本人带来的收益 并非最大的策略 例3:开金矿(三阶段) 在有完善的法律制度的条件下, 参与人1可以在参与人而不信 守承诺的情况下选择与其打官司, 这样就变成了一个三阶段博弈。 这时参与人1是否应相信2的承诺? 在法律制度建立后, 参与人2 的许诺变为可信 在法律健全时, 既可保障社会公平, 又可提高社会经济活动效率。 所谓可信的许诺(威胁), 就是指一旦采取该策略, 给他本人带来的收益一定 最大的策略 三、子博弈和逆推归纳法 (一)子博弈: 从一个博弈的某个阶段开始的 能够自成一个博弈的后续阶段。 它必须有一个初始信息集, 具备进行博弈的需要的各种信息。 (二)逆推归纳法: 从动态博弈的最后一个阶段 或最后一个子博弈开始, 逐步倒推以求解动态博弈的方法。 四、子博弈精炼纳什均衡 如果动态博弈中各参与人 的策略在动态博弈本身和 所有子博弈中都构成一个 纳什均衡,则称该策略组合为 一个子博弈精炼纳什均衡。 例4.讨价还价博弈(三阶段) 设两人就如何分割1万元进行谈判, 规则如下:首先由1提出 一个分割比例S1,2可以接 受也可以拒绝,如果2拒绝, 则提一个分割比例S2, 这时1可以接受, 也可以拒绝,如果拒绝, 则出价S则2必须接受 第一阶段,如果1的出价S1满足 1-S1≥δ(1-δ) 即S1≤1-δ+δ2 则2不会拒绝 因此,1的最优出价 S1=1-δ+δ2 这时 S1=1-δ+δ 2δ2 避免进入下一段谈判, 双方获得的收益均达到最大。 ¥ 第三节 有同时选择的动态博弈 一、特征: 在博弈的某些阶段, 有多个参与者同时进行决策 当博弈进行到第三阶段时,1,2必须同时作了决策, (或者说,每个参与人在决策时,并不知道对方作出了什么选择)。 这样在第三阶段构成了一个策略(静态)博弈(二人零和博弈)。 这个策略(静态)博弈有唯一的 一个混合策略纳什均衡: ( (1/2,1/2), (1/2,1/2)) , 其带给双方的期望收益(0,0) 这样这个博弈可以简化为 二、求解方法 (一)按逆推归纳法的思路进行求解。 (二)对同时选择构成策略(静态)博弈的阶段,分别应用策略(静态)博弈求解法求解 (三)将求解结果分别代入原博弈简化, 再按逆推归纳法求解。 例2
文档评论(0)