- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浅谈纳什均衡理论
浅谈纳什均衡理论
姓名:郭善禄 班级:11保险精算 学号:1008014
摘要:在本学期的校选修数学欣赏课上看了电影《美丽心灵(A Beautiful Mind)》使我感触非常深刻,尤其是对其中的主人公——约翰·纳什十分的敬佩和仰慕,由于我的经济学专业对其主要理论思想进行过一段时间的学习,因此纳什理论引起了我的很大兴趣,我查阅了很多关于这方面的资料,因此这次的期末论文也以此为题材。下面就让我们一同去了解和探寻这位有着传奇色彩的数学天才,诺贝尔学奖获得者的人生和博弈理论。
关键词:博弈论;纳什均衡;非合作博弈;合作共赢。
正文:1.纳什简介及博弈论的发展
1.1纳什简介
纳什均衡:Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名…约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。
纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
1.2博弈论的产生及发展
冯·诺依曼、摩根斯坦把对策论、运筹学引入经济学,形成了最早的博弈论。博弈论字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。
策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。
目前,博弈论发展的非常深入,这里只是介绍一些初步知识。几十年来,博弈论在经济学中发挥着越来越大的重要作用,1994年的诺贝尔经济学奖就授予三位博弈论学家:纳什、泽尔腾、和海萨尼。 1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。
2.纳什理论的主要内容
2.1博弈论的基本假设:
1、所有的博弈参与者都是理性的。通俗地讲就是大家都是明白人,谁也不比谁更傻,你想到的别人也想到了,而别人想到的你也能想得到。
2、非合作博弈仅仅从自己利益出发,仅仅利己。合作博弈是利人利己,利人也是为了利己,集体利益最大化以后再在集体中对个人进行补偿。
3、所有的人都是智能人。
4、共同知识,如果每个人都知道某个知识,每个局中人都知道每个局中人都知道它,如此等等,从而行如 “(每个局中人都知道)k每个局中人都知道它”的语句对k=0,1,2……都是正确的,那么我们就称这个知识为局中人中间的共同知识。
2.2“囚徒困境”的故事
博弈论中一个很著名的例子——囚徒困境,就是一具典型的纳什均衡。两个小偷在行窃现场附近被抓获并被警方隔离拷问。每个小偷都必须选择是否坦白和揭发对方。如果两个小偷都不坦白,他们都将判刑1年,如果每个小偷都坦白并揭发对方,他们都将判刑10年,但是,如果一个坦白并揭发对方,而另一个不坦白,那么与警方合作的小偷将被释放而另一个将判刑20年。他们的支付矩阵如下:
10,10
0,20
20,0
1,1 乙
坦白 不坦白
甲 坦白
不坦白
运用相对优势策略画线法,可以知道它有两个纳什均衡(10,10)和(1,1)。但是基于理性的前提假设,两个小偷符合自己利益的选择是坦白即(10,10),而对双方都有利的策略都不坦白而均只判刑1年的状况即(1,1)不会出现。这就出现了“囚徒困境”,从而造成了个人利益和整体利益的冲突。
囚徒困境是现实生活中许多现象的抽象概括,
文档评论(0)