混合策略纳什均衡.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGE1

混合策略纳什均衡

本章介绍各种混合策略纳什均衡的博弈。许多这类的问题需要读者去解决。有些混合策略的纳什均衡是显而易见的,如:投掷硬币(图3.8)。另一些就不那么直观了,如鹰鸽均衡(图3.10),但均衡可行性取决于问题的参数。例如,在鹰鸽博弈中,当鹰受伤的成本w增加时,玩鹰的可能性将下跌,当土地的价值v增加时,玩鹰的可能性也增加。但是,混合策略均衡在性别战中是不可信的,如图3.9,因为它表明,一个博弈方的纳什战略并不依赖于两个纯策略均衡结果的偏好强度。事实上,你之后将会知道这个混合策略均衡在演化动态(图12.17)中是不稳定的。

代数混合策略

这里有一个简单的方法来混合策略是代数混合策略。这种实例是非常程序化的,所以我将给出一个例子。读者将发现很容易进行推广。

假设Alice有一个策略集{L,R},使用混合策略ζ=αL+(1-α)R,Bob的策略

集是{U,D},使用混合策略然后我们认为Alice的支付

为正如图6.1表示Alice的复合彩票的支付。

我可以减少这种复合彩票到只有四种支付的简单彩票,(L,U),(L,D),

(R,U)和(R,D),概率分别是αβ,α(1-β),(1-α)β,(1-α)(1-

β)。博弈方i的彩票支付是

图6.1.复合彩票的混合策略

想到另一种方式来定义混合策略的产量

Alice的策略组合的支付为

狮子和羚羊

外出打猎的狮子看到远方有大羚羊和小羚羊无论是单独或联合,他们将会抓住任何他们追逐的猎物,无论是单独或联合。但是,如果

他们选择不同的羚羊追,没有需要分享,而如果他们追逐相同羚羊,每个将只获得一半的猎物而其他羚羊会逃跑。假设他们的决定是独立的,大羚羊的热量值为

C,小羚羊的热量值为C,其中0CC。BA的策略是“追捕大羚羊”,LA的策

b l l b

略是“追捕小羚羊”。博弈的标准式如图所示。狮子不能区分博弈方1和博弈方

2。只有对称的纳什均衡是可以接受的。

如果(BA,BA)是纯策略均衡,有必要假定C

b

/2≥C,容易看出这个条件是

l

足够的。因为CC,,很容易知道(LA,LA)不是纳什均衡。为了找出混合策

b l

略纳什均衡,我们假定(BA,BA)不是纳什均衡,因此C2C。狮子使用BA策

b l

略的概率为α。那么另一只狮子使用BA的支付为

使用LA策略的支付是

根据两个等式,我们得出

对于这两只狮子,混合策略的支付等于混合策略中的其中一个的策略的支付,因此这个支付等于BA策略的支付,是

这很容易看出之前的分数大于1/2,因此它们应该采取混合策略。

我们也可以计算出使用LA策略的预期支付,这个结果与使用BA策略的支付一样。

专利竞赛

Rapoport和Amaldoss(1997)建立了“专利竞赛”博弈,这个博弈是“弱”的博弈方将得到4,其中任何整数金额都可以项目投资,其回报为10。但是“强”的博弈方将得到5,两个博弈方都要接受指示,哪个博弈方对专利投入最多,那个人将得到10的回报,如果他们不分胜负,那么两个都不能得到回报10。很明显弱的博弈方有5个纯策略(投资0,1,2,3,4),强的博弈方可以从0,1,2,3,4,5中选择。博弈的支付在4.3节的矩阵(g)体现了。

通过连续消除严格劣策略,每个博弈方还剩下三个策略,然后当每一个博弈方分别采用概率(3/5,1/5,1/5)和(1/5,1/5,3/5)时,这个博弈有混合策略纳什均衡。,博弈方的预期支付是(4,10)。这实际上是这个博弈的唯一的纳什均衡,尽管很难显示出来。

网球策略

在网球比赛中,发球者可以发球给接受者的反手或正手。接受者可以预见球将从反手那边还是正手那边过来。接受者将更有可能准确地回球。另一方面,发球者

反手发球比正手发球更厉害。因而,接受者正确的预计反手发球的概率是60%,正确的预计正手发球的概率是90%。如果接受者错误的估计为正手发球,将得到回报为20%的时间,如果接受者错误的估计为反手发球,将得到回报为30%的时间。博弈的标准式如图所示,找出博弈的纳什均衡。

保护生态环境博弈

三家公司(1,2,3)使用湖水用于生产。每个公司都有两个纯策略:(策略

净化污水或转移污水到湖里(策略2)。我们假设,如果零或一家公司转移其污水入湖,水仍然是纯净的,但如果两个或两个以上的企业,水是不纯的,每个企业都遭受的损失为3。净化的成本为1。

我们将展示纳什均衡是:(a)一家公司总是污染水,另两家总是净化,(b)

所有的公司都污染,(c)每一家公司污染的概率 (d)每一家公司

净化的概率是

2/3。

或者(e)

文档评论(0)

hao187 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档