第5章 博弈与竞争策略【博弈论经典】.ppt

第5章 博弈与竞争策略【博弈论经典】.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 更为一般地,我们可以讨论商店位于任何位置的情况。假定商店1位于a≥0,商店2位于1-b(这里b≥0)。为不失一般性,假定1-a-b≥0(即商店1位于商店2的左边)。如果旅行成本为二次式,即旅行成本为td2,这里d是消费者到商店的距离,那么,需求函数分别为: 需求函数的第一项是商店自己的“地盘”(a是住在商店1左边的消费者,b是住在商店2右边的消费者),第二项是位于两商店之间的消费者中靠近自己的一半,第三项代表需求对价格差异的敏感度。 纳什均衡为: * (四)逆向归纳法求解子博弈精炼纳什均衡 对于我们现在所讨论的有限完全信息动态博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。 在求解子博弈精炼纳什均衡时,就可以从最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈均衡的方法。 用逆向归纳法求解子博弈精炼纳什均衡的过程,其实就是重复剔除劣策略过程在扩展式博弈上的扩展:从最后一个决策结开始依次剔除每个子博弈的劣策略,最后生存下来的策略即是精炼的纳什均衡。 * 三、重复博弈 重复博弈有下列三个基本特征: 一、阶段博弈之间无物质上的联系,也就是 说,前一阶段的博弈不改变后一阶段博弈的结构; 二、所有参与人都观察到博弈过去的历史; 三、参与人关心的是整个博弈的总得益,总得益是所有阶段博弈得益的贴现值之和。 * (一)有限次重复博弈 有限次重复博弈定义:给定一个博弈G, 重复进行T次G,并且在每次重复之前各博弈方都 能观察到以前博弈的结果,这样的博弈过程称为 G的一个“T次重复博弈”,记为G(T)。而G则称为 G(T)的原博弈。G(T)的每次重复称为G(T)的一个 阶段。 * 定理:令G是阶段博弈,G(T)是G重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。 这个定理中,必须注意的是,单阶段的博弈只有“唯一的”纳什均衡是一个必要的条件。否则如果纳什均衡不是唯一的,那么即使是重复有限次,重复博弈的均衡也不是单阶段博弈的简单重复,这里就不作讨论了。 * (二)无限次重复博弈 与有限次重复博弈不同,当博弈重复无穷多次时,会存在着完全不同于一次性博弈的子博弈精炼均衡。在无限次重复博弈中,因为博弈没有最后阶段,故不能用逆向归纳法求解。我们这里必须要引进另外的思想。首先,无限次重复的阶段博弈得益总和在很多情况下都趋于无穷大,故用总得益的大小来判断无限次重复博弈中的策略优劣是不可能的;其次,无限次重复博弈在现实问题中总归是一个漫长的过程,由于心理上的原因和实际利益的差异,人们总是更看重近期的利益,对远期的利益则相对看得轻一些。所以在研究重复博弈,特别是无限次重复博弈时,如果对不同阶段博弈的得益一视同仁,肯定是不合适 的,也不符合人们实际心理和行为规律。因此我们在分析无限次重复博弈时, 必须要解决不同阶段得益对参与人决策影响的差异问题。 * 四、不完全信息博弈基本概念 不完全信息博弈是指博弈的各参与人对其他参与人的得益函数不完全了解的博弈。 在不完全信息情况下的博弈参与人的最优策略不仅仅依赖于其他参与人的策略,更依赖于对其他参与人情况的判断。 * (一)海萨尼转换 1967年,海萨尼提出了“海萨尼转换”来处理这种不完全信息的博弈。其基本思路是引入一个虚拟的参与人——“自然” ,“自然”首先行动选定参与人的某种类型,各参与人知道自己是哪种类 型的(是高成本的,还是低成本的),但其他参与人不知道。 以对参与人类型的概率的分析代替对参与人确切行动的分析,这样的转换就是“海萨尼 转换”。 “不完美信息”指的是,“自然”作出了它的选择,但其他参与人并不知道它的具体选择是什么,仅知道各种选择的概率分布。 图7-6 (40,50) (-10,0) (30,80) (-10,100) (0,400) (0,300) 不进 [P] N [1-P] 不进 进 在位者 进 在位者 打击 打击 * 海萨尼转换是处理不完全信息博弈的标准方法。一般地,“自然”在博弈开始的时候选择参与人的类型,参与人的某个类型包括表征类型的各个特征如策略空间、信息集、得益函数等,这些又称为该类型参与人所拥有的个人信息。 不完全信息意味着,博弈各方中至少有一个参与人有多个

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档