《第三章传统博弈理论(2动态博弈)》选读.ppt

《第三章传统博弈理论(2动态博弈)》选读.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
作业讲解 张维迎《法律制度的信誉基础》一文的重复博弈模型 试计算:(1)请将该动态博弈模型转化为静态博弈模型? (2)划线法求解静态模型的纳什均衡解? (3)如果无限次重复博弈,达成{信任,诚实}的均衡结果,需要如何设计合适的触发策略?贴现因子的成立范围为多少? 分析:冷酷的触发策略设计为“当代理人诚实交易时保持信任,否则一旦不诚实则取消交易”; 无限期重复博弈,代理人诚实交易的收益:U诚实= 5+5δ+5δ2+…=5/(1-δ) 代理人不诚实交易的收益:U不诚实=10+0=10 当5/(1-δ)10时,即δ0.5时,双方将达成{信任,诚实交易}结局。 托马斯·克罗姆比·谢林(Thomas Crombie Schelling)(1921-) 是美国经济学家、马里兰大学公共政策学院教授,美国科学院院士,美国艺术与科学学院院士。研究领域是外交事务、国家安全、核策略和武器控制。 “通过博弈论分析改进了我们对冲突和合作的理解”,谢林与罗伯特·奥曼2005年共同获奖。 谢林最著名的著作《冲突的战略》(1960)开创了对议价和策略行为的研究,被认为是1945年以来西方影响最大的一百本书之一。 1971年,他发表了广为引用的关于种族动态研究的论文“种族隔离的动态模型”。其中解释了纯白人居住区是怎样迅速变为纯黑人居住区的,即使白人居民中没有人绝对反对居住在混合居住区中。(乌鲁木齐市南区) 谢林还参与了有关全球变暖的争论。 主流的数理博弈论:采用数学语言和公理性的方法来进行研究的。 谢林认为,决策主体的期望和行为无法通过纯粹的逻辑和数学推导而得。参与人在选择博弈战略时,不仅有数学上的考虑,也有传统、声誉、个性和社会等因素。 谢林放弃传统经济学的抽象假设和理性概念,基于更接近现实的观察和众多的实际应用,运用小模型和熟练的语言技巧,分析人们之间的相互影响及个人的自我控制等冲突情形中的行为。 该研究方法突破了新古典经济理论分析方法,创立了“非数理博弈理论”这一新的领域,从另一个角度完善和发展了现代博弈论。 概念和理论框架: (1)议价和冲突管理理论。代表性著作《冲突的战略》(1960) ; (2)相互依存的选择和行为理论。代表性著作《微观动机与宏观行为》(1978); (3)自我控制理论。代表作著作《选择与结果》(1984)。 思考:如何表述动态博弈问题? 启示:运筹学的决策理论中,动态决策(序贯决策)问题的表述方法 ——决策树是由决策点、事件点和结果构成的树图;采用逆序解法;决策准则常为最大收益期望值准则EMV。 类比:决策问题是博弈的一种特例,其中一方是自然参与者——博弈树 Von Neumann和O. Morgenstern(1944)提出“扩展式”模型,又称博弈树。用来描述参与者的行动顺序和采取行动时拥有的信息。 博弈树(game tree)的构成: 结点:包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬);若结点是有限的,则称有限次博弈。 枝:从一个决策结到直接后续结的连线,每一个枝代表参与者一个行动; 信息集:一个参与者无法作出区分的最大决策点集合(如图,囚徒B无法判断A的行动,因此其信息集为虚线连接)。 子博弈: (1)开始于博弈树的一个结点,该节点对应一个单独信息集; (2)包含从节点开始的博弈树整个部分; (3)从不分割一个信息集(针对后续的节点) 举例4:动态博弈在产业组织理论运用: 斯塔克伯格模型 斯塔克伯格(Stackelberg)模型: ——首先,领导者采取行动,其会预期对手的反应,并考虑对手反应后选择自己的策略; ——其次,追随者在接受领导者的策略后,采取最优策略。 斯塔克伯格双寡头模型 问题描述:两家企业生产同质产品,其中企业1为领先者,2为追随者,边际成本为常数,无固定成本:Ci = cqi, i=1,2 企业选择产量(连续变量)qi,市场均衡价格为:p = a-(q1+q2) 利润函数为: ui(q1,q2) = qi (p - c) 均衡分析(后退归纳法):企业2的最优产量: max u2(q1,q2) = q2 (a - q1 - q2 - c), 求导:q2*(q1) = (a - q1 - c)/2 领导者1预见到追随者2的上述决策后,做出如下最优决策: max u1(q1, q2*(q1) ) = q1 (a - q1 - q2*(q1) - c), 求导:q1* = (a - c)/2 均衡结果:最优产量q1* = (a - c)/2, q2*(q1) = (a - c)/4 均衡利润: u1* = (a - c)2/8, u2* = (a - c)2/16 思考:为什么领导者利润高于追随者?(完全信息) 多寡头模型

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档