王则柯-博弈论教程（四版）5第三章混合决策纳什均衡（2）.pptxVIP

下载本文档

14
0
约2.4千字
约 37页
2023-04-27 发布于浙江
举报
版权申诉

王则柯-博弈论教程（四版）5第三章混合决策纳什均衡（2）.pptx

1、本文档共37页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章混合策略纳什均衡(2); 3-3 多重纳什均衡及其筛选帕累托优势标准风险优势标准聚点均衡相关均衡抗共谋均衡颤抖手精炼均衡 ;3-3 多重纳什均衡及其甄别;1.帕累托优势标准;例子：猎人博弈;猎人博弈;2.风险优势标准;（1）期望赢利比较法;（2）偏离损失比较法;帕累托标准与风险优势的关系;帕累托优势标准: A 风险优势: 期望赢利比较法： B 损失偏离比较法： B 很多人会选择B。理由一：人是会犯错误的；理由二：人不喜欢冒大的风险（风险厌恶）。;判断;3.聚点均衡;例如：情侣博弈如果今天是男的生日， (足球，足球)可能是一个聚点均衡；而如果是女的生日，(芭蕾，芭蕾)可能是一个聚点均衡。这里，出现聚点均衡背后的原因是，在女的生日时，男的可能认为应该讨女的欢心，而女的也认为男的会认为应该讨自己欢心，结果，他们都出现在芭蕾舞厅。例如：靠右或靠左行驶是聚点均衡。具体靠哪边，要看习俗和默契。例如：通话过程中线路断了，怎么办？ ;路上有两辆车迎面而行，此时，两个司机各有两个选择：走路的左侧和走路的右侧。如果在中国，出现(R,R)，如果在英国，出现(L,L)。; 聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性，但因为它所涉及的方面众多，往往受博弈双方文化背景中的习惯或规范的影响，很难总结出具有普遍性的规律，只能具体问题具体分析地讨论。;4.相关均衡; “甲先到，走甲上乙左均衡；乙先到，走甲下乙右均衡”，且双方都认为对方先到达的概率相等。那么，每个人的期望支付为3，优于双方各自来用混合策略时所得到的期望支付2.5。;相关机制：各1/3概率发信号A、B、C 甲能看到是否A，乙能看到是否C “甲见A采用上，否则下；乙见C采用右，否则左”是一个纳什均衡。;当甲收到信号 A 时,他知道乙收到了信号 (A,B),因而乙将采用策略 “左”,在这种情况下,策略 “上”显然是甲的最优策略;如果甲观察到信号 (B,C),即非 A,则他将预期乙会以相同的概率采用策略 “左”或策略 “右”,此时无论甲选择策略 “上”还是策略 “下”,所得到的平均支付都是2.5,因此他会愿意采用策略 “??”。局中人乙的情况可按照类似的思路验证。所以,上述 “相关规则”构成一个纳什均衡。因为按照上述规则, (上,左)、 (下,右)和 (下,左)这三种结果各以1/3的概率出现,而 “坏”结果 (上,右)则不会出现,所以每个局中人的期望支付都是;5.抗共谋均衡; 博弈的纯策略纳什均衡：（U，L，A）、（D，R，B）前者帕累托优于后者。（U，L，A）有共谋 (coalition)问题：博弈方甲和乙同时偏离。;纳什均衡的精髓，是单独偏离没有好处。但是在纳什均衡要求的单独偏离没有好处的情况下，仍然可能存在若干局中人集体偏离或者说共谋偏离的激励。如果一个纳什均衡存在若干局中人集体偏离的激励，它是博弈的一个不稳定的结果。;抗共谋均衡;纯策略纳什均衡（ U，L，A ）不是抗共谋纳什均衡。试分析（D，R，B）是抗共谋纳什均衡。;结果;强均衡;例子：考虑如下一个三人博弈:参与人分别为甲、乙、丙,每个参与人都有两个纯策略可供选择:甲可选择 A 或者 B;乙可选择 C 或者 D;丙可以选择 E 或者F。;6.颤抖的手精炼均衡;纳什均衡(D，R)只要B有犯错误的可能，D就不是局中人A的最优选择。同样，只要A有犯错误的可能，R就不是局中人B的最优选择。 (U，L)却是一个颤抖手均衡：无论局中人A犯错误的概率有多大，只要犯错误的概率小于1，局中人B都没有激励要选择R；同样地，无论B犯错误的概率有多大，只要小于1，局中人A都没有激励选择D。;颤抖的手精炼均衡的定义; 定义中的必须是严格混合策略,即选择每一个纯策略的概率都严格为正。条件 (1)意味着,尽管每一个局中人i都有可能犯错误,但错误收敛于0。条件 (2)意味着,每一个局中人所选择的策略pi,不仅在其他人不犯错误时是最优的 (即符合纳什均衡的条件),而且在其他人错误地选择了时也是最优的。 ;例子：考虑每个局中人各有三种纯策略可供选择的如下二人策略型博弈,A 有上中下三个策略,B有左中右三个策略。各种策略对阵的得益如图数字所示。;局中人 A 的期望支付是： EUA =q[4(m-2)+3+2]/m+r[0(m-2)+2+1]/m + (1-q-r)[3(m-2)+1+2]/m = {q[4m-8+3+2]+3r+ (1-q-r)[3m-6+1+2]}/m = {q[4m-3]+3r+ (1-q-r)[3m-

您可能关注的文档

文档评论（0）

***** + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

王则柯-博弈论教程（四版）5第三章混合决策纳什均衡（2）.pptxVIP