序贯决策博弈.pptVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第四讲序贯决策博弈2024/4/271

序贯决策博弈的定义◆参与人的决策有先有后,后决策的参与人知道 先决策的参与人已经做出的决策,这种决策有先有后的博弈,称为序贯决策博弈,或简称为序贯博弈。◆先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做出最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?给定他的应对,什么是我的最优选择?2024/4/272

◆例:欺负他人可以获得快乐,你会欺负他人吗?不会。欺负他人会担心他人的报复,抵消了从欺负他人的行为中获得快乐。◆先行动者在选择行动时要考虑自己的选择对后行动者的影响。2024/4/273

参与人集合:,此外,虚拟参与人“自然”;参与人的行动顺序(theorderofmoves):谁在什么时候行动;参与人的行动空间(actionset):在每次行动时,参与人有些什么选择。参与人的信息集(informationset):每次行动时,参与人知道些什么;参与人的支付函数;扩展式表述的要素:序贯博弈的扩展式表述2024/4/274

序贯博弈的扩展式表述◆如何用扩展式表述来描述动态博弈?例1,解放初,美国总是寻找各种机会来侵犯我国。对此,毛主席提出了“人不犯我、我不犯人,人若犯我、我必犯人”的战略方针。◆该序贯博弈的战略式表述:参与人:美国、中国行动空间:美国:“犯我”或“不犯我”,中国:“犯人”或“不犯人”行动顺序:美国先行动,我国依美国的行动而后行动支付:这样假设支付情况:若美国“犯我”,中国“犯人”,则支付向量为(-2,-2);2024/4/275

n人有限战略的扩展式表述:博弈树(gametree)犯人犯我不犯我犯人不犯人不犯人美国我国我国(1,1)(3,-5)(2,-4)(-2,-2)若美国“犯我”,中国“不犯人”,则支付向量为(2,-4);若美国“不犯我”,中国“犯人”,则支付向量为(3,-5);若美国“不犯我”,中国“犯人”,则支付向量为(1,1)。2人有限博弈的博弈树:决策结:行动的时点枝终点结2024/4/276

进入博弈◆设想一个垄断企业因为他的产品一直可以卖高价赚取每年10亿元的利润。假定别的企业为了进入这个垄断的行业,需要投资4亿元的投资。当别的企业准备进入的时候,原有企业必须决策:或者“容忍”新的企业,他的利润降为5亿元。对方的利润也将是5亿元,但要减去4亿元进入投资,实得1亿元。或者,垄断企业进行“抵抗”,力图将进入者挤出去,这时垄断企业的利润降到2亿元,即使对方也得2亿元,却要投资4亿元,结果进入者亏损2个亿。2024/4/277

◆垄断者和进入者不同的行动组合下,博弈产生不同的结果:1、进入者进入,垄断者容忍;2、进入者进入,垄断者抵抗;3、进入者不进入,垄断者容忍;4、进入者不进入,垄断者抵抗。2024/4/278

容忍进入不进入容忍抵抗抵抗进入者垄断者垄断者(0,4)(0,10)(-2,2)(1,5)2024/4/279

策略与行动◆行动是每一个决策节点上参与人的决策变量或行动的具体选择。◆纯策略为一个决策规则,它能告诉这个参与人在每一个可能遇到的决策节点上应当采取的行动。◆在序贯博弈中,一个策略就是一个完整的行动计划。2024/4/2710

策略◆在进入博弈中,进入者的策略:进入和不进入。◆垄断者的策略:一、不管你怎样,我总是“容忍”;二、不管你怎样,我总是“对抗”;三、你进入我“对抗”,你不进入我“容忍”;四、你进入我“容忍”,你不进入我“对抗”;即垄断者的四个纯策略:{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。2024/4/2711

若A先行动,B在知道A的行动后行动,则A有一个决策节点,两个可选择的行动,策略空间为:(开发,不开发);B有两个决策节点,2个可选择的行动,B有四个纯策略:开发策略:不论A开发不开发,我开发——{开发,开发}追随策略:A开发我开发,A不开发我不开发——{开发,不开发};对抗策略:A开发我不开发,A不开发我开发——{不开发,开发};不开发策略:不论A开发不开发我不开发)——{不开发,不开发};策略空间为:{开发,开发}、{开发,不开发}、{不开发,开发}(不开发,不开发}。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xy’什么是参与人的策略?2024/4/2712

序贯博弈纳什均衡◆纳什均衡要求每个参与人的策略都是针对其它参与人的策略或策略组合的最佳策略选择,没有参与人愿意单独偏离这个策略组合。2024/4/2713

足球足球芭蕾足球芭蕾芭蕾男女女(1,2)(-1,-1)(0,0)(2,1)序贯情侣博弈2024/

文档评论(0)

152****7751 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档