- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 混合策略纳什均衡(2);
3-3 多重纳什均衡及其筛选
帕累托优势标准
风险优势标准
聚点均衡
相关均衡
抗共谋均衡
颤抖手精炼均衡
;3-3 多重纳什均衡及其甄别;1.帕累托优势标准;例子:猎人博弈;猎人博弈;2.风险优势标准;(1)期望赢利比较法;(2)偏离损失比较法;帕累托标准与风险优势的关系;帕累托优势标准:
A
风险优势:
期望赢利比较法:
B
损失偏离比较法:
B
很多人会选择B。
理由一:人是会犯错误的;
理由二:人不喜欢冒大的风险(风险厌恶)。;判断;3.聚点均衡;例如:情侣博弈
如果今天是男的生日, (足球,足球)可能是一个聚点均衡;而如果是女的生日,(芭蕾,芭蕾)可能是一个聚点均衡。这里,出现聚点均衡背后的原因是,在女的生日时,男的可能认为应该讨女的欢心,而女的也认为男的会认为应该讨自己欢心,结果,他们都出现在芭蕾舞厅。
例如:靠右或靠左行驶是聚点均衡。具体靠哪边,要看习俗和默契。
例如:通话过程中线路断了,怎么办?
;路上有两辆车迎面而行,此时,两个司机各有两个选择:走路的左侧和走路的右侧。
如果在中国,出现(R,R),如果在英国,出现(L,L)。; 聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,但因为它所涉及的方面众多,往往受博弈双方文化背景中的习惯或规范的影响,很难总结出具有普遍性的规律,只能具体问题具体分析地讨论。;4.相关均衡; “甲先到,走甲上乙左均衡;乙先到,走甲下乙右均衡”,且双方都认为对方先到达的概率相等。那么,每个人的期望支付为3,优于双方各自来用混合策略时所得到的期望支付2.5。;相关机制:
各1/3概率发信号A、B、C
甲能看到是否A,乙能看到是否C
“甲见A采用上,否则下;乙见C采用右,否则左”是一个纳什均衡。;当甲收到信号 A 时,他知道乙收到了信号 (A,B),因而乙将采用策略 “左”,在这种情况下,策略 “上”显然是甲的最优策略;如果甲观察到信号 (B,C),即非 A,则他将预期乙会以相同的概率采用策略 “左”或策略 “右”,此时无论甲选择策略 “上”还是策略 “下”,所得到的平均支付都是2.5,因此他会愿意采用策略 “??”。局中人乙的情况可按照类似的思路验证。所以,上述 “相关规则”构成一个纳什均衡。
因为按照上述规则, (上,左)、 (下,右)和 (下,左)这三种结果各以1/3的概率出现,而 “坏”结果 (上,右)则不会出现,所以每个局中人的期望支付都是;5.抗共谋均衡; 博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)
前者帕累托优于后者。
(U,L,A)有共谋 (coalition)问题:博弈方甲和乙同时偏离。;纳什均衡的精髓,是单独偏离没有好处。但是在纳什均衡要求的单独偏离没有好处的情况下,仍然可能存在若干局中人集体偏离或者说共谋偏离的激励。如果一个纳什均衡存在若干局中人集体偏离的激励,它是博弈的一个不稳定的结果。;抗共谋均衡;纯策略纳什均衡( U,L,A )不是抗共谋纳什均衡。
试分析(D,R,B)是抗共谋纳什均衡。;结果;强均衡;例子:
考虑如下一个三人博弈:参与人分别为甲、乙、丙,每个参与人都有两个纯策略可供选择:甲可选择 A 或者 B;乙可选择 C 或者 D;丙可以选择 E 或者F。;6.颤抖的手精炼均衡;纳什均衡(D,R)只要B有犯错误的可能,D就不是局中人A的最优选择。同样,只要A有犯错误的可能,R就不是局中人B的最优选择。
(U,L)却是一个颤抖手均衡:无论局中人A犯错误的概率有多大,只要犯错误的概率小于1,局中人B都没有激励要选择R;同样地,无论B犯错误的概率有多大,只要小于1,局中人A都没有激励选择D。;颤抖的手精炼均衡的定义; 定义中的 必须是严格混合策略,即选择每一个纯策略的概率都严格为正。
条件 (1)意味着,尽管每一个局中人i都有可能犯错误,但错误收敛于0。
条件 (2)意味着,每一个局中人所选择的策略pi,不仅在其他人不犯错误时是最优的 (即符合纳什均衡的条件),而且在其他人错误地选择了 时也是最优的。
;例子:
考虑每个局中人各有三种纯策略可供选择的如下二人策略型博弈,A 有上中下三个策略,B有左中右三个策略。各种策略对阵的得益如图数字所示。;局中人 A 的期望支付是:
EUA =q[4(m-2)+3+2]/m+r[0(m-2)+2+1]/m
+ (1-q-r)[3(m-2)+1+2]/m
= {q[4m-8+3+2]+3r+ (1-q-r)[3m-6+1+2]}/m
= {q[4m-3]+3r+ (1-q-r)[3m-
文档评论(0)