博弈论10 均衡概念比较与PBNE的再精炼.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论10均衡概念比较与PBNE的再精炼重点讲义

第十章 精炼贝叶斯均衡的再精炼 及其他均衡概念 不完全信息博弈可能存在多重精炼贝叶斯均衡,究竟哪一个均衡实际上出现,依赖于我们如何规定非均衡路径上的后验概率。 什么是参与人1的均衡战略,依赖于参与人2认为什么不是他(参与人1)的均衡战略,或者说,参与人2认为什么是参与人l的均衡战略,什么就是参与人1的均衡战略,均衡是自动实现的。 尽管精炼贝叶斯均衡的精炼条件剔除了不可置信的战略(行动),促它没有剔除不可置信的信念(后验概率)。 非均衡战略上后验概率的任意性导致了均衡战略的任意性;当我们把某个行动从潜在均衡战略中排除掉时,我们同时就将另一些行动转化为均衡战略。 出现多重均衡是很自然的。 10.1剔除劣战略 剔除劣战略方法的思路是将“不选择劣战略”的要求扩展到非均衡路径的后验概率上。 它的基本思想是,在一个博弈中,如果对于某些类型的参与人,存在某些行动劣于另—些行动,而对于另一些类型的参与人这一点不成立,那么,当其他参与人观测到前一类行动时,他不应该以任何正的概率认为选择该行动的参与人属于前一类参与人。 ? ? 图1 不完美信息博弈 ?1* +0*(1- ) ≤ 0* + 1*(1- ), ≤1/2,,如果博弈进入参与人2的信息集,他将选择B。显然,R弱劣于M。因此,在博弈开始,参与人2不应该认为参与人1会以任何正的概率选择R;如果博弈进入参与人2的信息集,他应该认为参与人1选择M的概率是1(即 =1)。在这个要求下,均衡(L,B; ≤1/2)被剔除,只有(M,U; =1)是满足这个要求的精炼贝叶斯均衡。 剔除劣战略方法正式定义: 令a1′和a1″是参与人1的两个行动,a1′,a1″∈A1。对于参与人2的所有行动a2′,a2″∈A2,如果下列条件成立,我们说对类型θ1∈θ1的参与人1,a1′弱劣于a1″: u1(a1′,a2′,θ1)≤u1(a1″,a2″,θ1) (至少有一个严格不等式对于某些(a2′,a2″)成立。) 要求: 在所有的信息集上,对于参与人2的每—个可能的后验概率和行动,a1′弱劣于a1″。这样严格要求的原因是,参与人1在选择自己的行动时,必须考虑自已的行动传递给参与人2的有关自己(参与人1)类型的信息。 10.2 直观标准(更适用信号博弈) 在均衡中,至少有一个类型的参与人1想偏离均衡。“直观标准”剔除所有这些不合理的精炼贝叶斯均衡。 “直观标准”将劣战略扩展到相对于均衡战略的劣战略,从而通过剔除更多的劣战略的办法缩小均衡数量,进一步改进了精炼贝叶斯均衡概念。 10.2 直观标准 定义:假定(a1*,a2*;μ)是一个精炼贝叶斯均衡。令u1*(θ1)是类型为θ1的参与人1的均衡效用水平。那么,a1′是参与人1相对于均衡的劣战略(a1*,a2*;μ),如果对参与人2的所有行动,下列条件成立: u1(a1′, a2,θ1)≤u1*(θ1) (至少有一个严格不等式对某些成立。) 进一步,令Θ1∈Θ是所有满足上述不等式θ1的集合,如果Θ1≠Θ,那么,参与人2的非均衡路径上的合理的后验概率是: 10.3 克瑞普斯一威尔逊序贯均衡 粗略地讲,克瑞普斯一威尔逊序贯均衡的基本思想是,在子博弈精炼纳什均衡或贝叶斯均衡概念上增加一个新的要求. 这个新的要求是:在博弈到达的每一个信息集上(不论该信息集在均衡路径还是非均衡路径),参与人的行动必须由某种有关之前发生的事情(自然选择了什么类型或先行动者选择了什么行动)的信念(概率)“合理化”。 克瑞普斯和威尔逊处理非均衡路径上后验概率的办法是: 首先假定,在每一个信息集上,参与人选择严格混合战略(即以严格正的概率选择每一个行动),从而博弈到达每一个信息集的概率严格为正,贝叶斯法则在每一个信息集上都有定义; 然后将均衡作为严格混合战略组合和与此相联系的后验概率的序列的极限。 这样,检查一个战略组合和后验概率是否是一个均衡就变成:它是否是某个严格混合战略组合和与此相联系的后验概率的序列的极限。 定义(σ,μ)是一个序贯均衡,如果它满足下列两个条件: (1)(σ,μ)是一个序贯性的:在所有的信息集h上,给定后续概率μ(h),没有任何参与人i想偏离σi(h);对于所有可行战略σ′i(h), (2)(σ,μ)是一致的:存在一个严格混合战略组合序列{σm}和贝叶斯法则决定的概率序列μm,使得是的(σ,μ)极限;即: 一致性要求是序贯均衡概念最重要的创造。序列可以理解为均衡的“颤抖”;颤抖使得贝叶斯法则适用于博弈的所有路径。 例、不完全信息动态博弈如下: 该博弈的PBNE是 对1来说,最优的混合混合策略是p1=(1,0,0),

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档