混合策略纳什均衡课件.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
答案:用反应曲线法找到政府与流浪汉博弈的混合策略纳什均衡 第三十一页,共六十八页。 练习:混合策略的纳什均衡 下面的博弈是否存在纯策略的纳什均衡,如果没有采用混合策略纳什均衡分析。试用支付最大化法和支付等值法两种方法算一算混合策略的纳什均衡是多少?通过反应曲线,求得混合策略的纳什均衡. 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 第三十二页,共六十八页。 对于博弈方1采用的混合策略,博弈方2的支付无差异 对于博弈方2采用的混合策略,博弈方1的支付无差异 策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6 解出PA=0.8,PB=0.2;PC=0.8,PD=0.2 第三十三页,共六十八页。 夫妻之争的混合策略纳什均衡 看看这个博弈有几个均衡? 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 第三十四页,共六十八页。 存在两个纯策略均衡 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 第三十五页,共六十八页。 还存在混合策略纳什均衡 2, 1 0, 0 0, 0 1, 3 时 装C 足 球F 时装C 足球F 丈 夫 妻 子 夫妻之争 妻子的混合策略 丈夫的混合策略 夫妻之争博弈的混合策略纳什均衡 策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75 第三十六页,共六十八页。 夫妻之争博弈 r q 1 1 1/3 1/3 (r,1-r):丈夫的混合策略概率分布 (q,1-q):妻子的混合策略概率分布 第三十七页,共六十八页。 练习如何画反应曲线 在以下收益矩阵,我们令参与人A选择“上”的概率为r,选择“下”的概率为1-r,同样,我们令参与人B选择“左”的概率为c,选择“右”的概率为1-c。当r和c等于0时,相应的策略为纯策略。根据收益矩阵和参与人选择的概率,可以得到参与人的期望收益。 同学A 同学B 上r 下1-r 左c 右1-c 2,1 0,0 0,0 1,2 第三十八页,共六十八页。 根据上表,参与人A的期望收益为:2rc+(1-r)(1-c)。即:2rc+1-r-c+rc。 如果r增加了△r,A的收益变化为:2c△r-△r+c△r=(3c-1)△r。即如果3c1时,A将增加r,如果3c1,A将减少r,如果3c=1时,他对于任意的0≤r≤1无差异。 组合 概率 参与人A的收益 上,左 rc 2 下,左 (1-r)c 0 上,右 r(1-c) 0 下,右 (1-r)(1-c) 1 第三十九页,共六十八页。 根据同样的方法,得到参与人B的期望受益:cr+2(1-c)(1-r)。 当c增加△c时,B的收益变化为:(3r-2)△c。 因此,当r2/3时,B增加c将增加收益;当r2/3时,B将减少c;当r=2/3时,他对于任意的0≤c≤1无差异。 利用以上两个结论可以绘制参与人的最优反映曲线。 第四十页,共六十八页。 如果参与人B选择c=0,那么参与人A将减少r,使r尽可能小,所以r=0。因此,参与人A使r=0就是对c=0的最优反应。并且,r=0一直都是A的最优反应,直至c=1/3。当c=1/3,0≤r≤1都是A的最优反应。对于所有的c1/3,行参与人的最优反应是r=1。 ? 0 ? c 1/3 r 1 ? 1 ? A的反应曲线 ? 2/3 ? B的反应曲线 ? ? ? 三个红色的点 为纳什均衡, 两个为纯策略 均衡。 第四十一页,共六十八页。 § 多重纳什均衡及其甄别 帕累托优势标准 风险优势标准 帕累托优势标准和风险优势标准 聚点均衡 相关均衡 抗共谋均衡 第四十二页,共六十八页。 看看这个博弈有几个纯策略纳什均衡? -5, -5 -10, 8 8, -10 10, 10 战争 和平 国家2 战争 和平 国 家 1 战争与和平博弈 帕累托优势标准 第四十三页,共六十八页。 帕累托优势标准 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个按帕累托优势 标准筛选出来的纳什均衡。 -5, -5 -10, 8 8, -10 10, 10 战争 和平 国

文档评论(0)

虾虾教育 + 关注
官方认证
内容提供者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档