- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 Nash均衡 主要内容: 一、占优行为 二、重复剔除劣战略行为; 三、Nash均衡。 囚徒困境的例子 首先考察博弈论中最为经典的一个博弈模型——“囚徒困境”(prisoners’ dilemma)博弈。 “囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。 “囚徒困境”(prisoners’ dilemma) 两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小偷从律师那里得知:如果两个人都坦白,将被各判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其中一人坦白另一人抵赖,坦白的将会得到宽大处理而被无罪释放,而抵赖的将被重判,判刑6年。试问两个小偷将会如何选择? “囚徒困境”(prisoners’ dilemma) 第一个问题 除了(坦白,坦白)和(抵赖,抵赖)以外,“囚徒困境”是否还会出现其它的结果呢? 比如说一个人坦白,另一个人抵赖? 第二个问题 当两个小偷都选择“坦白”时,是否会有人偏离“坦白”而选择“抵赖” ? “囚徒困境”的寓意 虽然结果(抵赖,抵赖)是结果(坦白,坦白)的Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的 ,这种对所有人都有好处的“改进”两人都无法得到。 这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。 “囚徒困境”的例子 寡头垄断市场上厂商间的价格大战; 20世纪90年代末期我国出现的彩电企业间的价格大战; 有关中小学生教育方式的选择,家长明知素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让自己的孩子参与各种名目的“模拟考试”或“考试培训”。 “囚徒困境”(prisoners’ dilemma) 一、占优行为 考察更一般的n人博弈情形。在n人博弈中,参与人 i ( i=1,2,...,n)的支付ui= ui(si, s-i)既与自己的选择si有关,也与其他参与人的选择s-i有关。 在一般情况下,使参与人的支付ui= ui(si, s-i)最大化的最优战略 是与其他人的选择s-i有关的。 1. 占优战略 但可能会出现这样的情况:参与人的最优战略 与其他参与人的选择 无关。 也就是说,无论其他参与人选择什么战略,参与人的最优战略总是惟一的。这样的最优战略我们称为“占优战略”(dominant strategy)。 定义1:占优战略 在n人博弈中,如果对于所有的其他参与人的选择 , 都是参与人 i 的最优选择,即 ,有 则称 为参与人的占优战略。 在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略。 参与人的这种选择行为我们称为占优行为。 占优行为是理性参与人选择行为的最基本特征。 例1 2. 占优战略均衡 如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略。 博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategy equilibrium)。 定义2 :占优战略均衡 在n人博弈中,如果对所有参与人 i (i=1,2,...,n) ,都存在占优战略 ,则占优战略组合 称为占优战略均衡。 在一个博弈问题中,如果所有参与人都有占优战略存在,那么占优战略均衡就是惟一的所有理性参与人可以预测到的博弈结果。 “新产品开发博弈”中的占优战略均衡 当市场需求大时,在完全信息静态的“新产品开发博弈”中,企业1和2都有占优战略“开发”,因此,博弈的结果为占优战略均衡(开发,开发)。 例2 占优战略均衡是 ? 主要内容: 一、占优行为 二、重复剔除劣战略行为; 三、Nash均衡。 二、重复剔除劣战略行为 在“囚徒困境”中,“坦白”是小偷的占优战略,也就是说,相对于战略“抵赖”,“坦白”在任何情况下都是小偷的最优选择。因此,小偷只会选择战略“坦白”。 反过来也可以这么理解:相对于战略“坦白”,小偷选择“抵赖”所得到的支付都要小于选择“坦白”所得到的。既然选择“抵赖”的所得总是小于选择“坦白”的所得,小偷当然就不会选择“抵赖”,这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。 考察更一般的n人博弈情形:在n人博弈中,不存在占优战略,但是参与人i存在两个战略 和 ( ), 虽然
文档评论(0)