[经济学]CH6附 博弈论.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[经济学]CH6附 博弈论

高级语言课程设计 CH6附 博弈论 6.1 博弈论的基础知识 6.1.1 博弈与博弈论 博弈论(Game theory)又称对策论、游戏理论或策略运筹学。 它最早由德国数学家、哲学家莱布尼兹于1710年提出。1713年,瓦尔德格雷夫首次提出了对策论中德极大中的极小定理。然而直到1944年,以冯·诺伊曼和奥斯卡·摩根斯坦合著德《博弈论与经济行为》一书的出版为标志,博弈论才得以广泛应用于经济学领域,并成为微观经济学的一个新的重要组成部分。 1994年10月11日,瑞典皇家科学院将该年度诺贝尔经济学奖授予纳什(普林斯顿大学)、海萨尼(加州大学)与泽尔腾(波恩大学),因为他们长期致力于博弈论及其在经济学中运用的研究。 2005年10月10日,诺贝尔经济学奖授予罗伯特·奥曼(希伯来大学数学研究院)和托马斯·谢林(美国马里兰大学),因为他们在博弈论方面的贡献。前者主要贡献在于决策的制定方面;后者提出威慑理论,使经济学分析扩展到外交、军事等领域。 博弈论是研究决策主体的行为发生直接作用时的决策以及这种决策的均衡问题。可见,博弈论与传统经济学的区别在于,个人效用或利润不仅依赖于自己的选择,而且还依赖于他人的选择。 博弈论包括合作博弈和非合作博弈两种类型,生活中的很多游戏如打扑克、下棋就同时包含两种形式的博弈。而我们谈到的博弈论,一般指非合作博弈,如下象棋。 博弈论发展的基本历程(以论文发表为标志): 1950年,22岁的纳什发表论文《N个人博弈的均衡点》与《讨价还价问题》,1951年又发表《非合作博弈》,1950年塔克在《两个之谜》的论文中对“囚徒的困境”作了明确的定义,两者基本上奠定了非合作博弈论的基石,提出了纳什均衡(NE); 1965年,泽尔腾在其论文《需求减少条件下寡头垄断模型的博弈论描述》,将纳什均衡的概念引入动态分析,提出“子博弈完美纳什均衡”(SPNE); 1967年,海萨尼在其论文《由贝叶斯局中人参加的不完全信息博弈》将不完全信息引入博弈分析,并提出“贝叶斯均衡”的概念; 20世纪80年代,克瑞普斯和威尔逊则对不完全信息动态博弈的研究作出了突出的贡献,并提出了更高级的均衡概念:“贝叶斯—纳什均衡“或”完美贝叶斯均衡“(PBE) 6.1.2 博弈论的基本概念 博弈论的基本概念包括参与人、行动、信息、策略、得益、结果和均衡。 参与人(Players)指一个博弈中的决策主体,其目的是通过选择行动(或策略)以最大化其得益水平,因此每个人都有可供选择的行动和一个很好定义的偏好函数; 行动(Action)是指参与人在博弈的某个时点的决策变量,往往会有行动集合、行动顺序; 信息(Information)是指参与人有关博弈的知识,特别时有关”自然“的选择、其他参与人的特征和行动的知识,完全信息是指没有事前的不确定性; 策略(Strategies)是指参与人在给定信息集的情况下的行动规则,规定参与人在什么时候选择什么行动,即”相机行动方案“; 得益(Pay-off)是指在一个指定的策略组合下参与人得到的确定效用水平,或期望效用水平; 结果(Outcome)是指博弈分析者所要揭示的东西,是分析者感兴趣的要素集合,如均衡策略组合、均衡行动组合、均衡得益组合等; 均衡(Equilibrium)是指所有参与人的最优策略组合或行动组合。 6.1.3 博弈的类型 第一个角度参与人行动的先后顺序,可以分为静态和动态两种。静态博弈指的是,在博弈中参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指参与人行动有先后顺序,且后行动者能观察到先行动者的选择。 第二个角度是参与人对有关其他参与人的特征、策略空间及得益函数的知识。完全信息是指知识准确,否则是不完全信息。 6.2 完全信息静态博弈:NE 6.2.1 最优(占优)策略均衡 是指不论其他参与人的策略如何,能够使自己的得益(效用)对自己最有利的策略。 假定A、B两个厂商生产同类产品,同时面临是否自己进行广告促销的策略决策,得益矩阵如下: 6.2.2 重复剔除的最优策略均衡(智猪博弈) 在大多数情况下,最优策略均衡是不存在的,尽管如此,在有些博弈中我们仍可以应用最优策略的逻辑找到均衡。 假定猪圈里有一头大猪和一头小猪,猪圈两头有猪食槽和按钮,每按一次有8个单位进槽,但按钮的需要支付2个单位。若大猪先到,大猪吃7个单位,小猪吃1个单位;若小猪先到,大猪和小猪各吃到4单位;若两猪同时到,大猪吃5个,小猪吃3个。每头猪都有“按钮”和“等待”两种策略。得益矩阵见下表: 现实生活中有很多应用的例子:股份公司中,大股东必须承担起绞尽脑汁、多方收集信息以监督经理的责任,而小股东则节约“脑细胞”,进行“免费搭车”;股票市场也是如此,对散户而言,“紧跟大户”往往是最优选择,而大户必须

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档