第十一讲广延型博弈与反向归纳策略.ppt

下载文档

2
0
约4.53千字
约 73页
2017-06-11 发布于上海
举报
版权申诉
保障服务

第十一讲广延型博弈与反向归纳策略.ppt

1、本文档共73页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第十一讲广延型博弈与反向归纳策略广延型博弈适合于分析动态博弈过程，其强调的重点在行动的时序性，以及参与人决定策略时所拥有的信息集。第一节广延型博弈的定义与形式一、广延型博弈的定义信息完美(perfect　information)，是指每一个参与人在其作决策时，对于以前所发生的事件具有完全的信息。广延型博弈构成要素 (1)决策点与决策分枝的结构，在初始决策点与最终结局点之间不存在任何闭环(closedloops)； (2)清楚地指明什么决策点属于哪一个参与人； (3)在自然决策点上选择的概率是公共知识； (4)参与人作决策时所依据的信息集；信息集把参与人在某一时刻的所有决策点分成若干类； (5)在博弈的终极点上每一个参与人的收益二、广延型博弈的形式广延型博弈是以“决策树”或“博弈树” 的形式来表达的。三、广延型博弈的规则第一，初始点没有一条箭头指向它；对其他所有箭头，都只有一条箭头指向它。第二，如果我们从某一点向初始点返回，我们就不可能再通过迂回的途径回这一点，我们只能按反向逐次返回原点。第二节完美信息广延（动态）博弈一、特征。（一）决策有先后顺序（二）关于博弈进程的信息是不对称的后决策者拥有更多信息。（三）具有完美信息：即参与人决策时完全了解之前的博弈过程的信息。（四）动态博弈至少有两个阶段；阶段：参与者在某一时点进行的一次决策。二、可信性：先决策者对后决策者行为的信任性。即先决策者是否相信后决策者是否采取有利的（许诺）或不利的（威胁）行为。例1：父女博弈。女儿交了一个父亲不喜欢的男友，父亲威胁说：“你如果不断绝与他的关系，我与你断绝关系。” 女儿是否相信父亲的威胁？这一博弈可如下表示：作为女儿，知道父亲断绝与女儿的关系损失是非常大的，因此，对父亲来讲，即使女儿不听话，“断绝”是下策，应被剔除掉：父亲的威胁是不可信的。因此，所谓不可信的威胁，就是指一旦采取该策略，给他本人带来的收益并非最大的策略例2：开金矿（二阶段）：参与人2欲开采一价值4万元的金矿，但缺乏1万资金，参与人1恰拥有一万元资金。参与人2对参与人1说： “如果你把钱借给我，我与你平分开金矿所得。” 参与人1是否应相信2把钱借给他？参与人2的许诺是不可信的。所谓不可信的许诺，就是指一旦采取该策略，给他本人带来的收益并非最大的策略例3：开金矿（三阶段）在有完善的法律制度的条件下，参与人1可以在参与人而不信守承诺的情况下选择与其打官司，这样就变成了一个三阶段博弈。这时参与人1是否应相信2的承诺？在法律制度建立后，参与人2 的许诺变为可信在法律健全时，既可保障社会公平，又可提高社会经济活动效率。所谓可信的许诺（威胁），就是指一旦采取该策略，给他本人带来的收益一定最大的策略三、子博弈和逆推归纳法（一）子博弈：从一个博弈的某个阶段开始的能够自成一个博弈的后续阶段。它必须有一个初始信息集，具备进行博弈的需要的各种信息。（二）逆推归纳法：从动态博弈的最后一个阶段或最后一个子博弈开始，逐步倒推以求解动态博弈的方法。四、子博弈精炼纳什均衡如果动态博弈中各参与人的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡，则称该策略组合为一个子博弈精炼纳什均衡。例4.讨价还价博弈（三阶段）设两人就如何分割1万元进行谈判，规则如下：首先由1提出一个分割比例S1，2可以接受也可以拒绝，如果2拒绝，则提一个分割比例S2，这时1可以接受，也可以拒绝，如果拒绝，则出价S则2必须接受第一阶段，如果1的出价S1满足 1-S1≥δ(1-δ) 即S1≤1-δ+δ2 则2不会拒绝因此，1的最优出价 S1=1-δ+δ2 这时 S1=1-δ+δ 2δ2 避免进入下一段谈判，双方获得的收益均达到最大。￥第三节　有同时选择的动态博弈一、特征：在博弈的某些阶段，有多个参与者同时进行决策当博弈进行到第三阶段时，1，2必须同时作了决策，（或者说，每个参与人在决策时，并不知道对方作出了什么选择）。这样在第三阶段构成了一个策略（静态）博弈（二人零和博弈）。这个策略（静态）博弈有唯一的一个混合策略纳什均衡： ( (1/2,1/2), (1/2,1/2)) ，其带给双方的期望收益（0，0）这样这个博弈可以简化为二、求解方法（一）按逆推归纳法的思路进行求解。（二）对同时选择构成策略（静态）博弈的阶段，分别应用策略（静态）博弈求解法求解（三）将求解结果分别代入原博弈简化，再按逆推归纳法求解。例2