第二章博弈论.ppt

下载文档

14
0
约4.88千字
约 40页
2017-05-30 发布于北京
举报
版权申诉
保障服务

第二章博弈论.ppt

1、本文档共40页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

严格劣战略严格劣战略：某一个参与人可能采取的战略中，相对于其他可选的战略，对自己严格不利的战略。例如，在智猪博弈中，“等待”是小猪的占优战略，“按”是小猪的严格劣战略。重复剔除占优均衡假定某个参与人存在劣战略，找出这个劣战略并将其剔除，然后构造一个不包含这个劣战略的新的博弈；再剔除这个新的博弈中某个参与人的劣战略，构造一个新的博弈；重复这个过程，直至剩下一个唯一的战略组合，这个战略组合即“重复剔除占优均衡”。例如，在智猪博弈中，战略组合（按，等待）是该博弈的重复剔除占优均衡。【例】找出下列博弈的重复剔除占优战略均衡。 B L M P A u 4，3 5，1 6，2 d 2，1 8，4 3，6 e 3，0 9，6 5，8 B L P A u 4，3 6，2 d 2，1 3，6 e 3，0 5，8 B L P A u 4，3 6，2 B L A u 4，3 注意：重复剔除的占优战略不仅要求每个参与人是理性的，而且要求“理性”是参与人的共同知识。什么是理性？ ——博弈论中，有一个基本的假定就是，所有的博弈参与者都是理性的。通俗地讲就是大家都是明白人，谁也不比谁更傻，你想到的别人也想到了，而别人想到的你也能想得到。纳什均衡性别战博弈——不存在重复剔除的占优战略均衡女方看足球听音乐会男方看足球 3，1 0，0 听音乐会 0，0 1，3 纳什均衡的定义有n个参与人的战略式表述博弈G={S1,…,Sn;U1,…,Un}，战略组合s*=(s1*,…,si*,…,sn*)是一个纳什均衡，如果对于每一个参与人i，si*是给定其他参与人选择s*-i=(s1*,…,s*i-1,s*i+1,…,sn*)的情况下第i个参与人的最优战略。纳什均衡定义的通俗理解假设有n个人参与博弈，纳什均衡指的是这样一种战略组合，这种战略组合由所有参与人的最优战略组成，也就是说，给定别人战略的情况下，没有任何单个参与人有积极性选择其他战略，从而没有任何人有积极性打破这种均衡。注：有限个局中人参与的有限行为对策。纳什均衡与占优战略均衡、重复剔除的占优均衡之间的关系每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡，但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优战略均衡。纳什均衡一定是在重复剔除战略过程中没有被剔除的战略组合，但没有被剔除的战略组合不一定是纳什均衡，除非它是唯一的。对于两人有限博弈来讲，有一个求得纳什均衡的有限办法：先考虑A的战略，对于第一个给定的B的战略，找出A的最优战略，在其对应的支付下画一横线；然后用同样的方法找出B的最优战略。在完成这个过程后，如果某个支付格内的两个数字都有横线，则这个数字格对应的战略组合就是一个纳什均衡。一个博弈可能会有多个纳什均衡，究竟哪一个会出现，需要知道博弈进行的具体过程。【例】 B L M P A u 0，3 3，0 5，2 d 3，0 0，3 5，2 e 2，5 2，5 7，7 纯战略与混合战略纳什均衡定义：如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动，则称该战略为纯战略。如果一个战略规定参与人在给定某种概率分布随机地选择不同的行动，则称该战略为混合战略。完全信息动态博弈每个参与者都有关于各方收益的全部知识，但是参与者的行动是有先后顺序的，且后行动者能在自己行动之前能观察到此前其他参与者的行动。博弈的解：子博弈精炼纳什均衡不完全信息博弈也称贝叶斯博弈。在完全信息博弈中，参与人的收益函数是共同知识，而在不完全信息博弈中，至少有一个参与人不能确定其他参与者的收益函数。不完全信息动态博弈的例子【例】：张三和李四过几天就要进行搏斗，张三很想知道李四是不是强者？最初，张三判断李四是强者的概率为0.8，是弱者的概率是0.2，所以，张三不敢轻敌。后来，张三观察到李四不喜欢吃辣椒，由此推断李四不是强者。李四为了不让张三看出他是弱者，故意吃了很多辣椒。李四判断不出张三究竟是强者还是弱者，所以他仍然不敢轻敌。不完全信息动态博弈的应用：应用：信息传递模型——雇主与求职者雇主不知道求职者的能力，通过观察求职者的受教育水平来判断求职者的能力。高能力的人为了能够把自己和低能力的人区分开来，就选择接受更多的教育。雇主认为受教育水平高的人是高能力的，所以支付高工资。 * 一、博弈论的产生与发展二、博弈论的基本概念三、博弈论的分类四、完全信息静态博弈　　在西方学术界，对博弈决策问题的研究可以追溯到18世纪甚至更早时期。但一般认为，1944年冯·诺依曼(Von　neumann)和奥斯卡·摩根斯特恩(Oskar　Morgenstern)合作出版的《博弈论与经济行为》(