北大精品课件《博弈论与公共政策》之完全信息动态博弈.ppt

下载文档 降价啦

13
0
约4.35千字
约 59页
2015-09-11 发布于重庆
举报
版权申诉
保障服务

北大精品课件《博弈论与公共政策》之完全信息动态博弈.ppt

1、本文档共59页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论与公共政策北京大学精品课件完全信息动态博弈主要内容一、动态博弈的特例：决策分析二、博弈的扩展式表述三、动态博弈的均衡四、子博弈精炼纳什均衡五、应用举例六、重复博弈一、动态博弈的特例：决策分析作为一名管理者，面临的最基本和最重要的任务也许就是做决策。可是，有时决策是很困难的，特别是处于不确定环境中，或者在一个决策之后还要做进一步决策的时候。有没有一般的模式或方法可循？决策分析就提供了一种系统而有效的方法，其基本工具是决策树。例1：合同纠纷甲、乙双方在签订一项合同后，乙方违约。乙方提出和解，愿意赔偿7万元。甲方如果上法庭，可望获得10万元赔偿，但要付出2万元的诉讼费用。甲方应当接受和解还是上法庭？决策树逆向归纳法从右往左逐步分析。在这个过程中： ① 对于机会结，计算期望收益，并将相应的值写在该结下面。 ② 对于决策结，还是做两件事：第一，在较劣的决策枝上划叉；第二，将对应于最优决策枝的收益写在该决策结下面。 ③ 一旦某个结点下面标了值，在以后进一步分析该结点的父结点时，就只考虑该结点的值而不再考虑其右边的子决策树。例3：交通事故和解谈判在一次交通事故中，被告同意赔偿4万元以和解。原告如果坚持上法庭，需要花1万元的诉讼费，有可能出现三种结果：结果1：得到包括误工费在内总额为10万元的赔偿，概率为50%；结果2：仅得到2万元的修车费赔偿，概率为30%；结果3：得不到任何赔偿，概率为20%。甲方应当接受和解还是上法庭？例4：购买土地某人打算购买土地，现有A、B两块地可以选择。A、B两块地的售价分别为30万元和25万元。这两块地看起来差不多，所以买方起初打算购买价格更便宜的B。但是，买方进一步了解得知，B可能存在环境问题，因为该地过去被堆放过大量垃圾，而A不存在类似问题。如果B被危险垃圾污染，依照法律规定，买方必须进行无害化处理，成本为20万元。买方估计，B被危险垃圾污染的概率为50%。在决定到底买哪块地之前，买方也可以先请环保机构进行检测，看到底是否需要进行无害化处理，检测费为2万元。买方是否需要先请环保部门监测？还是直接购买A或B？首先考虑，买方在开始有几种选择？二、博弈的扩展式表述 1、博弈的扩展式表述 ① 参与者 ② 每个参与者在何时行动 ③ 每次轮到某一参与者行动时，可供他选择的行动 ④ 每次轮到某一参与者行动时，他所了解的信息 ⑤ 对应于参与者可能选择的每一行动组合，各个参与者的收益通常可以用博弈树来描述博弈的扩展式（请与决策树比较）：例5 ：简单诉讼博弈甲、乙双方在签订一项合同后，乙方违约。甲方可以选择控告，并索赔8000元，但控告需要花3000元诉讼费；甲方也可以选择忍受，一切维持现状。一旦甲方控告并提出索赔，乙方可以提出和解并赔偿8000元；乙方也可以选择上法庭。如果上法庭，甲方将胜诉，乙方将被判赔偿9000元，且双方各需要支出2000元的诉讼费。甲方应当控告还是忍受？博弈树通过引入机会结，我们也可以纳入存在不确定性的情况，如下图：博弈树 2、信息集参与者的一个信息集是指满足以下两个条件的决策结的集合： ① 在此信息集中的每一个结点都轮到该参与者行动。 ② 当博弈的进行达到该信息集中的一个结，应该行动的参与者并不知道达到了信息集中的哪一个结。 3、策略参与者的一个策略是关于行动的一个完备计划，它明确了在参与者可能遇到的每一种情况下对可行行动的选择。思考：在下面的博弈中，两个参与者各自的策略空间分别是什么？例 6 4、扩展式表述与标准式表述任何博弈都既可用标准式表述，又可用扩展式表述。（1）用扩展式表述囚徒困境博弈（第1讲中的例1）第1讲之例1：囚徒困境（2）用标准式表述例6中的博弈三、动态博弈的均衡 1、利用标准式表述求纳什均衡 2、在博弈树上找纳什均衡四、子博弈精炼纳什均衡 1、可置信的威胁与不可置信的威胁一种威胁所规定的行动在事前看来是最优的，但事后看并不是参与者的最优选择，这种威胁就是不可置信的，含有这种威胁的策略就不是一个合理的策略。例7：台湾问题 2、承诺在博弈论中，所谓承诺是将不可置信的威胁变成可置信的威胁的行动：威胁不仅是事前最优的，也是事后最优的。承诺意味着限制自己的自由：选择少反而对自己好。比如例7中的台湾问题：立法还是政府随机应变？ 3、子博弈扩展式博弈中的子博弈是指博弈的一部份，要求： ① 始于博弈树中一个单结信息集的决策结，但不包括博弈的第一个决策结； ② 包含该决策结之下所有的决策结和终点结； ③ 没有分割任何信息集。 4、子博弈精炼纳什均衡如果参与者的策略组合在每一子博弈中都构成纳什均衡，则称该策略组合是子博弈精炼纳什均衡。子博弈精炼纳什均衡排除了不可置