- 1、本文档共61页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京大学博弈论课件第3章_完全信息动态博弈
* . 本章小结和习题 * * 如果第四个海盗提出的分配方案没有得到超过半数海盗的同意,那么第四个海盗也将被扔到海里喂鲨鱼。 这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来的100个金币,博弈结束。 在这种分配规则下,第一个海盗将提出怎样的分配方案? 第一个海盗提出的分配方案需要满足两个条件。 第一,保证超过半数的海盗同意第一个海盗的分配方案。 第二:第一个海盗最大化自己能分到的金币。 如果直接从第一个海盗的决策策略入手,此问题相对复杂。 不妨从第五个海盗入手,然后按照从后向前的顺序依次逆向考察海盗的策略选择。 * 2.求解海盗分宝博弈的均衡 第一个海盗将提出怎样的分配方案?此分配方案在保证能得到超过半数海盗同意的前提下应最大化第一个海盗的利益。 轮次 分配方案提出者 分配方案 最后一轮 海盗5 自己独吞全部100个金币 倒数第二轮 海盗4 任何分配方案都得不到通过 倒数第三轮 海盗3 分配给第三个海盗100个金币,第四个海盗0个金币,第五个海盗0个金币。 倒数第四轮 海盗2 分配给自己98个金币,第三个海盗0个金币,第四个海盗1个金币、第5个海盗1个金币。 通过逆向归纳法推导出的财宝分配方案 * 3.海盗分宝博弈的均衡 第一个海盗的分配方案可以有两种。 分配方案 1:分配给自己 97 个金币,给第二个海盗 0 个金币,给第三个海盗 1 个金币,给第四个海盗 2 个金币,给第五个海盗 0 个金币。 分配方案 2:分配给自己 97 个金币,给第二个海盗 0 个金币,给第三个海盗 1 个金币,给第四个海盗 0 个金币,给第五个海盗 2 个金币。 如果第一个海盗提出分配方案 1,那么第二个海盗和第五个海盗将反对,而第一个、第三个和第四个海盗将同意,因此第一个海盗的提议将获得通过。 如果第一个海盗提出分配方案 2,那么第二个海盗和第四个海盗将反对,而第一个、第三个和第五个海盗将同意,因此第一个海盗的提议将获得通过。 * 二、扩展形式博弈的策略表达方式 1.将扩展形式的博弈改写为策略形式 动态博弈的扩展表达形式 * 参与者2 U V 参与者1 L (a1,b1) ( a2,b2) R ( a3,b3) ( a4,b4 ) 错误的动态博弈策略表达形式 * 参与者2 (U,U) (U,V) (V,U) (V,V) 参与者1 L (a1,b1) (a1,b1) (a2,b2) (a2,b2) R ( a3,b3) (a4,b4) (a3,b3) (a4,b4) 动态博弈的策略表达形式 * 参与者2 (U,U,U) (U,U,V) (U,V,U) (U,V,V) (V,U,U) (V,U,V) (V,V,U) (V,V,V) 参与 者1 L (a1,b1) (a1,b1) (a1,b1) (a1,b1) (a2,b2) (a2,b2) (a2,b2) (a2,b2) M (a3,b3) (a3,b3) (a4,b4) (a4,b4) (a3,b3) (a3,b3) (a4,b4) (a4,b4) R (a5,b5) (a6,b6) (a5,b5) (a6,b6) (a5,b5) (a6,b6) (a5,b5) (a6,b6) 动态博弈的扩展表达形式 动态博弈的策略表达形式 * 2.扩展形式转化为策略形式时的规律 参与者 1 的纯策略空间为: 参与者 2 的纯策略空间为: 参与者 3 的纯策略空间为: * 参与者 2 的纯策略空间为: 参与者 1 的纯策略空间为: * 第三节 子博弈与逆向归纳法 在图中,用虚线框起来的部分称作一个子博弈(Sub-Game)。 * 一、子博弈 子博弈是原始动态博弈的一部分。子博弈包含博弈所需的各种信息,能独立构成一个博弈。 一个博弈的子博弈需要满足四个条件。 1.子博弈的起始节点不能是原来博弈的起始节点 2.子博弈不能分割信息集 3.有些博弈包含多个子博弈 4.有些博弈没有子博弈 * 二、逆向归纳法 1.逆向归纳法的定义和求解方法 逆向归纳法指:在求解动态博弈时,首先找到博弈顺序在最后的子博弈,找到子博弈中博弈参与者的策略选择,然后按博弈顺序由后向前逆向归纳,直至博弈树的初始节点,从而找到博弈的均衡。 * 1.逆向归纳法的定义和求解方法 逆向归纳法指:在求解动态博弈时,首先找到博弈顺序在最后的子博弈,找到子博弈中博弈参与者的策略选择,然后按博弈顺序由后向前逆向归纳,直至博弈树的初始节点,从而找到博弈的均衡。 * * 2.通过逆向归纳法求解博弈均衡实例 * 三、斯塔贝尔伯格寡头博弈 斯塔贝尔伯格博弈(Stackelberg Duopoly Game)是寡头博弈的一种常见形式,是一种完全信息动态博弈。 1.斯塔贝尔伯格寡头博弈的定义 斯塔贝尔伯格寡头博弈:市场中有两个厂商。厂商
文档评论(0)