- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《博弈论:原理、模型与教程》第02章 Nash 均衡 第01节 占优行为
《博弈论:原理、模型与教程》
第一部分 完全信息静态博弈
第2章 Nash 均衡
本章将通过分析理性参与人在博弈中的选择行为,探讨完全信息静态问题的求解,并给出完全信息静态博弈的解—Nash均衡。
2.1 占优行为
(已精细订正!)
首先考察博弈论中最为经典的一个博弈模型—“囚徒困境”(prisoners’ dilemma)博弈。
两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小头偷从律师那里得知:如果两个人都坦白,将被个判刑年;如果两个人都抵赖,将会因为证据不足而各判年;如果其个一人坦白另一人抵赖,坦白的讲将会得到宽大处理而被无罪释放,而抵赖的将被重刑,判刑年。试问两个小偷将会如何选择?
上述“囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。
在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。
图2-1给出了“囚徒困境”博弈问题的战略式描述。
显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一小偷的选择有关,那么小偷如何选择呢?
不妨这样考虑小偷的决策过程:假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。也就是,给定另一小偷的决策,寻找自己的最优决策。
对于每个小偷,当对方坦白时,自己坦白得,抵赖得,所以应该选择“坦白”;而当对方抵赖时,自己坦白得,抵赖得,所以还是应该选择“坦白”。也就是说,无论对方如何选择,每个小偷都会选择 “坦白”。因此,博弈的结果就是两个小偷都选择“坦白”。
两个小偷都选择“坦白”,这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的种结果(即、、、)中,虽说不能肯定这个结果是最差的,但它显然不如。这是因为导致两个小偷都得,而却能使大家都得,也就是说,是Pareto优于的。既然选择“抵赖”对双方都有好处,那么两个小偷是否都会选择“抵赖”呢?只要小偷是前面所假设的完全理性的参与人,答案就是否定的。
不妨假设两个小偷都选择“抵赖”,现在分析小偷的这种选择是否是理性的。对小偷1而言,小偷2选择“抵赖”的情况下,自己选择“抵赖”得,选择“坦白”得,显然“坦白”优于“抵赖”。因此,理性的小偷1将会偏离“抵赖”而选择“坦白”。基于同样的原因,理性的小偷2也会偏离“抵赖”而选择“坦白”。
除了和以外,“囚徒困境”是否会出现其他结果呢?比如说一个人坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。
剩下的问题是:当两个小偷都选择“坦白”时,是否有人偏离“坦白”而选择“抵赖”。基于同样的分析,两个小偷只要是理性的,这种情况就不会发生。因此,虽然结果是结果的Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的,这种对所有人都有好处的“改进”两人都无法得到。这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。
事实上,“囚徒困境”在现实生活中有着许多应用。也许“囚徒困境”博弈是人们虚构出来的一个博弈模型,但在现实生活中与“囚徒困境”相似的情形却很多。例如,寡头垄断市场上厂商间的价格大战,就是典型的“囚徒困境“。20世纪90年代末期我国出现的彩电企业间的价格大战就是这种情形,还有目前人们议论比较多的有关中小学生教育方式的选择。家长明知道素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让孩子参与各种名目的“模拟考试”或“考试培训”,这也是典型的“囚徒困境”。诸如此类的例子,现实生活中还有很多。
进一步分析“囚徒困境”中小偷的战略,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。
考察更一般的人博弈情形。人博弈中,参与人的支付既与自己的选择有关,也与其他参与人的选择有关。因此,在一般情况下, 使某参与人的支付最大化的最优战略与其他参与人的选择有关。但在某些特殊情况下,如“囚徒困境”博弈中,可能会出现这样的情况:参与人的最优战略与其他人参与人的无关。也就是说,无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略称为“占优战略”(dominant strategy),如“囚徒困境”中参与人的“坦白”战略。
定义2-1 在人博弈中,如果对于所有的其他参与人的选择,都是参与人的最优选择,即,有
则称为参与人的占优战略。
显然,在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人
您可能关注的文档
- 《南昌东湖会计培训学校首选【卓越昂立会计培训】南昌最优秀的会计培训学校.doc
- 《3.大学计算机应用基础及上机实验指导第5章中文PowerPoint203.ppt
- 《南昌光达商场附近会计上岗证培训学校首选【卓越昂立会计培训】南昌通过率超高的会计培训学校.doc
- 《南昌光达商场附近会计从业证培训机构首选【卓越昂立会计培训】南昌通过率超高的会计培训中心.doc
- 《南昌光达商场附近会计从业证培训机构首选【卓越昂立会计培训】南昌通过率超高的会计培训机构.doc
- 《3.大学计算机信息技术试验指导第1章1.1信息与信息技术.ppt
- 《3.大学计算机应用基础第五章演示文稿制作软.ppt
- 《3.大学计算机基础-第4章1.ppt
- 《南昌光达商场附近会计培训学校首选【卓越昂立会计培训】南昌最强的会计培训中心.doc
- 《3.大学英语应用写作之信件写作2.ppt
文档评论(0)