混合战略Nash均衡.pptVIP

  1. 1、本文档共102页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
混合战略Nash均衡

第三章混合战略Nash均衡 主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。 一、混合战略 “猜硬币”博弈 两个参与人各握有一枚硬币,双方同时选择是正面向上(记作O)还是背面向上(记作R),即他们的战略空间都是{O, R}。若两枚硬币是一致的(即全部背面向上或者全部正面向上),参与人2赢得参与人1的硬币;若两枚硬币不一致,则参与人1赢得参与人2的硬币。 猜硬币博弈的特征: 每位参与人都想猜透对方的战略,而每位参与人又都不能让对方猜透自己的战略。 在“猜硬币”游戏中,我们会以50%的概率选择正面(O),以50%的概率选择反面(R)。像这种以一定的概率分布来选择自己战略的行为,在博弈论中称之为混合战略(mixed strategy)。 纯战略: 参与人在给定信息下只选择一种特定战略(或行动)。 混合战略: 参与人给定信息下以某种概率分布随机地选择不同的行动。它可以定义为战略空间(集)上概率分布。 定义1:混合战略 在博弈 中,对任一参与人i,设 ,则参与人i的一个混合战略为定义在战略集 上的一个概率分布 其中 表示参与人i选择战略 的概率,即 满足: 混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。 支付 1) 纯战略时 2) 混合战略时: 其中, 为参与人j采取 中 的概率, 表示 发生的概率。 其中, 看下面的例子: 参与人1 的混合战略 参与人2 的混合战略 ; 在混合战略组合 下,战略组合 、 、和 出现的概率就分别为 。 参与人1采用纯战略a1和a2的期望效用分别为 参与人1在混合战略组合σ=(σ1, σ2)下的期望效用为 参与人2采用纯战略b1和b2的期望效用分别为 参与人2在混合战略组合σ=(σ1, σ2)下的期望效用为 主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。 二、混合战略Nash均衡 提一个问题: 在“猜硬币”游戏中,我们往往会以50%的概率选择正面(O),以50%的概率选择反面(R),即选择混合战略σ=(0.5,0.5)。那么有没有参与人会偏离混合战略σi=(0.5,0.5)呢? 在“猜硬币”博弈中,当双方都选择混合战略 σi=(0.5,0.5)时,双方的期望收益都为0。 如果参与人1保持混合战略σ1=(0.5,0.5) ,那么无论参与人2选择其它什么样的混合战略,只要参与人1保持混合战略σ1=(0.5,0.5)不变,参与人2的期望收益都为0,不会增大。也就是说,偏离并不能给参与人2带来好处。 同理,偏离也不能给参与人1带来好处。 因此,在“猜硬币”博弈中,双方都不会偏离混合战略组合σ=((0.5,0.5),(0.5,0.5))。像这样的混合战略组合我们称之为混合战略Nash均衡。 定义2 :混合战略Nash均衡 在博弈 中,混合战略组合 为一个Nash均衡,当且仅当 。 对简单的博弈问题,容易根据定义判断出Nash均衡。但对于一些复杂的博弈问题,要找到Nash均衡尤其是混合战略Nash均衡是非常不容易的。 为了求解混合战略Nash均衡,必须了解在选择混合战略的情况下,参与人如何剔除劣战略以及参与人最优混合战略的特性。 参与人i的最优混合战略的构成:给定其他参与人的选择σ-i ,假设 为参与人i的最优混合战略,那么

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档