- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
完全信息动态博弈分析
完全信息动态博弈分析
吴建设
逆推归纳法
逆推归纳法:是求解完美信息动态博弈的
经典方法。
从博弈的最后一个阶段开始分析,若B选择
L获利1, 选择R获利0 ,
因此B选L 。
倒退到第一阶段,A选U
获利2 ,选D获利取决于B
的选择。
逆推归纳法
但A知道B是理性的,一旦到达第二阶段,
B肯定选择L ,从而,A获利3 。因此,A应
该选择D 。
因此,(D, L)是纯策略
纳什均衡。
比较:策略式表述
策略式(收益矩阵)表述
见右下图。
可见,它有两个纳什均衡:
(3, 1) 和(2, 2)。
如果A选择U, B 的信息集
就不可达,即B 的信息集 B
不在均衡路径上。 L R
A U 2, 2 2, 2
D 3, 1 0, 0
逆推归纳法与策略式分析的比较
逆向归纳法实际上是严格
下策反复删去法在扩展式
描述的动态博弈中的应用。
逆向归纳法不适合无限
博弈。
逆向归纳法不适合不
完美信息博弈。 B
L R
逆向归纳法剔出了非
A U 2, 2 2, 2
理性的均衡策略。 D 3, 1 0, 0
逆推归纳法:海盗分赃
5个海盗抢来100个金币,大家决定分赃
的方式是:由海盗一提出一种分配方案,如
果同意该方案的人数达到半数,则该提议通
过并实施。否则该提议人将被扔进大海,然
后由接下来的海盗重复提议过程。
假定每个人都绝顶聪明,也不相互合作,
并且极度自私,那么第一个海盗该如何提议
。
逆推归纳法:海盗分赃
逆推归纳法的求解思路如下:
首先考虑只剩下最后一个海盗:海盗5,其
他四个海盗已经被扔进大海,显然,他会
分给自己100金币,自己同意并通过。
逆推到只剩下海盗4和海盗5的情况,海盗4
会分给自己100金币,不给海盗5分。海盗4
自己同意并通过,海盗5 反对但无用。
再回到海盗3,海盗3会给海盗5一枚金币以
获取他的支持,给自己99枚,海盗 3和海
盗5同意并通过。
逆推归纳法:海盗分赃
逆推归纳法的求解思路如下:
首先考虑只剩下最后一个海盗:海盗5,其
他四个海盗已经被扔进大海,显然,他会
分给自己100金币,自己同意并通过。
逆推到只剩下海盗4和海盗5的情况,海盗4
会分给自己100金币,不给海盗5分。海盗4
自己同意并通过,海盗5 反对但无用。
再回到海盗3,海盗3会给海盗5一枚金币以
获取他的支持,给自己99枚,海盗 3和海
盗5同意并通过。
逆推归纳法:海盗分赃
逆推归纳法的求解思路如下:
回到海盗2,他分给海盗4一枚 金币,以获
取海盗4的支持,分给 海盗3和海盗5零枚
金币,海盗2和海盗4同意并通过,海盗3和
海盗5
文档评论(0)