网站大量收购独家精品文档,联系QQ:2885784924

序贯决策博弈课件.ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序贯决策博弈课件

傅袁马砂豺恫葵竭隘铁侧乔绿赞赡泡决龟劣绞颠帝深棘馅猖歪灰刃漱渣泥序贯决策博弈课件序贯决策博弈课件;揭刑淘肝泻星琵陷峨遥加脏茹儿伊暖堤华嘴扛控诽音踪蹋勋聪筷犬癣炕韧序贯决策博弈课件序贯决策博弈课件;本章主要介绍: 1、如何用正规型表示和展开型表示来表述 同一个博弈。 2、博弈论中的两个重要概念:信息集和不完美信息。 3、考察包含同时决策行动和序贯决策行动的复合型博弈(混合博弈)的纳什均衡。;第一节 博弈的正规型表示与展开型表示 第二节 同时决策与序贯决策的混合博弈 第三节 树形博弈的子博弈 第四节 子博弈精炼纳什均衡 第五节 完美博弈的库恩定理 第六节 动态博弈的运用 ;一、如何将博弈的展开型形式转化为正规型表示 案例:“进入障碍”博弈;1,5;1、一般我们将先行动者放在行局中人的位置,把后行动者放在列局中人的位置。 2、每个局中人的策略必须是一个完整的计划,必须考虑自己在对方每一个行动下的行动。例如:{容忍,容忍}。在本例中,进入者有两个纯策略,而垄断者有四个纯策略。 3、每个局中人的决策轮数越多,则他的纯策略选择的数目越多。 思考:如果有三轮博弈,如何写矩阵形式。 4、矩阵形式表示的可能的博弈结果比树形表示的结果要多,这是因为有不止一个纯策略可以导致相同的博弈结果。;比前面简单,尤其是序贯博弈,但如果是同时博弈,如何表示? 信息集 案例:情侣博弈 ;根据同时博弈的定义,每个局中人决策时不知道别人的策略,即每个局中人在做自己的行动选择时,并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时,并不知道丈夫选的是芭蕾还是足球。 局中人不能是别人对方“已经”做出的行动或决策,就等于同时行动或决策。 此时,我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个 信息集。 即局中人知道博弈已经进行到他的这个信息集,但不知道博弈究竟进行到这个信息集中的哪个 决策节点。;妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信息集中的那个决策点,即她不知道丈夫会选什么,因此是同时博弈。;一个信息集罩住的必须是同一个局中人的决策点。 必须是同一个局中人在同一个时点的决策节点。;同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。;我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。 因此,每一个决策位置都是一个信息集,只有单点集和非单点集之分。;当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史清清楚楚,他清楚了博弈具体走到了他的这个决策节点而不是别的决策点。我们把这种历史清楚的博弈称为完美信息博弈。 但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弈具体走到了他的这个信息集里面的那个决策点。我们把这种历史不清楚的博弈称为不完美信息博弈。 如果一个序贯博弈的每个信息集都是一个单点集,那么该序贯博弈就是完美信息博弈,否则他就是不完美信息博弈。;;;;;;;;我们把包含同时决策行动和序贯决策行动的博弈称为混合博弈。 假设有两家计算机公司:方正和联想。彼此对新产品的研发和定价进行博弈竞争。该博弈分为两个阶段: 第一阶段,两个公司进行研发投入竞争,每个公司都可以选择“大投入”和“小投入”的研发预算,同时每个公司都不公开公布自己的预算; 第二阶段,当产品开发出来并面世以后,厂商会观摩对方研制出来的新产品对自己的新产品定价,每个厂商可以定高价也可以定低价,但定价之前看不到对方的定价。;联想;联想;联想;;案例情况: 两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资者变现,共可收回2r,这里DrD/2。不过,如果银行允许投资项目到期,则项目共可取得2R,这里RD。有两个时间,投资者可以从银行提款:在银行的投资项目到期之前或者在到期之后。为使分析简化,假设不存在贴现。;两个投资者的提款日期可以有如下可能: A、两个都提前,都得到r B、一个提前提取另一个不动,则第一人得D,另一人得2r-D. C、两个在到期后提,各得R D、两个都不提,等到投资项目结束,都得到R E、如果一个人在期满后提取,另一人不动则分别得:2R-D,D。 如下图所示:;悠昼爹守滓灸湘淡臣猿蜡踊滤忙庄筑逊阑缄篡约构匪赚菱挨令匿倪烩纶软序贯决策博弈课件序贯决策博弈课件;我们使用逆向归纳法分析问题 从日期2开始先考虑日期2的标准式博弈,由于明显的RD,也就是说2R-DR。我们可以得到这个博弈的纳什均衡(R,R)。 由于不存在贴现,我们可以直接带入日期1的博弈矩阵表示式。

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档