北大精品课件《博弈论与公共政策》之完全信息动态博弈.ppt

北大精品课件《博弈论与公共政策》之完全信息动态博弈.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北大精品课件《博弈论与公共政策》之完全信息动态博弈.ppt

博弈论与公共政策 北京大学精品课件 完全信息动态博弈 主要内容 一、动态博弈的特例:决策分析 二、博弈的扩展式表述 三、动态博弈的均衡 四、子博弈精炼纳什均衡 五、应用举例 六、重复博弈 一、动态博弈的特例:决策分析 作为一名管理者,面临的最基本和最重要的任务也许就是做决策。可是,有时决策是很困难的,特别是处于不确定环境中,或者在一个决策之后还要做进一步决策的时候。 有没有一般的模式或方法可循?决策分析就提供了一种系统而有效的方法,其基本工具是决策树。 例1:合同纠纷 甲、乙双方在签订一项合同后,乙方违约。乙方提出和解,愿意赔偿7万元。甲方如果上法庭,可望获得10万元赔偿,但要付出2万元的诉讼费用。 甲方应当接受和解还是上法庭? 决策树 逆向归纳法 从右往左逐步分析。在这个过程中: ① 对于机会结,计算期望收益,并将相应的值写在该结下面。 ② 对于决策结,还是做两件事: 第一,在较劣的决策枝上划叉; 第二,将对应于最优决策枝的收益写在该决策结下面。 ③ 一旦某个结点下面标了值,在以后进一步分析该结点的父结点时,就只考虑该结点的值而不再考虑其右边的子决策树。 例3:交通事故和解谈判 在一次交通事故中,被告同意赔偿4万元以和解。原告如果坚持上法庭,需要花1万元的诉讼费,有可能出现三种结果: 结果1:得到包括误工费在内总额为10万元的赔偿,概率为50%; 结果2:仅得到2万元的修车费赔偿,概率为30%; 结果3:得不到任何赔偿,概率为20%。 甲方应当接受和解还是上法庭? 例4:购买土地 某人打算购买土地,现有A、B两块地可以选择。A、B两块地的售价分别为30万元和25万元。这两块地看起来差不多,所以买方起初打算购买价格更便宜的B。但是,买方进一步了解得知,B可能存在环境问题,因为该地过去被堆放过大量垃圾,而A不存在类似问题。如果B被危险垃圾污染,依照法律规定,买方必须进行无害化处理,成本为20万元。买方估计,B被危险垃圾污染的概率为50%。 在决定到底买哪块地之前,买方也可以先请环保机构进行检测,看到底是否需要进行无害化处理,检测费为2万元。 买方是否需要先请环保部门监测?还是直接购买A或B? 首先考虑,买方在开始有几种选择? 二、博弈的扩展式表述 1、博弈的扩展式表述 ① 参与者 ② 每个参与者在何时行动 ③ 每次轮到某一参与者行动时,可供他选择的行动 ④ 每次轮到某一参与者行动时,他所了解的信息 ⑤ 对应于参与者可能选择的每一行动组合,各个参与者的收益 通常可以用博弈树来描述博弈的扩展式(请与决策树比较): 例5 :简单诉讼博弈 甲、乙双方在签订一项合同后,乙方违约。甲方可以选择控告,并索赔8000元,但控告需要花3000元诉讼费;甲方也可以选择忍受,一切维持现状。一旦甲方控告并提出索赔,乙方可以提出和解并赔偿8000元;乙方也可以选择上法庭。如果上法庭,甲方将胜诉,乙方将被判赔偿9000元,且双方各需要支出2000元的诉讼费。 甲方应当控告还是忍受? 博弈树 通过引入机会结,我们也可以纳入存在不确定性的情况,如下图: 博弈树 2、信息集 参与者的一个信息集是指满足以下两个条件的决策结的集合: ① 在此信息集中的每一个结点都轮到该参与者行动。 ② 当博弈的进行达到该信息集中的一个结,应该行动的参与者并不知道达到了信息集中的哪一个结。 3、策略 参与者的一个策略是关于行动的一个完备计划,它明确了在参与者可能遇到的每一种情况下对可行行动的选择。 思考: 在下面的博弈中,两个参与者各自的策略空间分别是什么? 例 6 4、扩展式表述与标准式表述 任何博弈都既可用标准式表述,又可用扩展式表述。 (1)用扩展式表述囚徒困境博弈(第1讲中的例1) 第1讲之例1:囚徒困境 (2)用标准式表述例6中的博弈 三、动态博弈的均衡 1、利用标准式表述求纳什均衡 2、在博弈树上找纳什均衡 四、子博弈精炼纳什均衡 1、可置信的威胁与不可置信的威胁 一种威胁所规定的行动在事前看来是最优的,但事后看并不是参与者的最优选择,这种威胁就是不可置信的,含有这种威胁的策略就不是一个合理的策略。 例7:台湾问题 2、承诺 在博弈论中,所谓承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前最优的,也是事后最优的。 承诺意味着限制自己的自由:选择少反而对自己好。 比如例7中的台湾问题:立法还是政府随机应变? 3、子博弈 扩展式博弈中的子博弈是指博弈的一部份,要求: ① 始于博弈树中一个单结信息集的决策结,但不包括博弈的第一个决策结; ② 包含该决策结之下所有的决策结和终点结; ③ 没有分割任何信息集。 4、子博弈精炼纳什均衡 如果参与者的策略组合在每一子博弈中都构成纳什均衡,则称该策略组合是子博弈精炼纳什均衡。 子博弈精炼纳什均衡排除了不可置

文档评论(0)

docindpp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档