网站大量收购独家精品文档,联系QQ:2885784924

其他类型的对策论简介.pptVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
其他类型的对策论简介

§4 其他类型的对策论简介 在对策论中可以根据不同方式对对策问题进行分类,通常分类的方式有: (1)根据局中人的个数,分为二人对策和多人对策; (2)根据各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对策; (3)根据局中人是否合作,又可分为合作对策和非合作对策; (4)根据局中人的策略集中个数,又分为有限对策和无限对策(或连续对策); (5)也可根据局中人掌握信息的情况及决策选择是否和时间有关可分为完全信息静态对策、完全信息动态对策、非完全信息静态对策及非完全信息动态对策;也可以根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策。 本节只对对策论中非合作对策的完全信息对策、多人非合作对策、非零和对策作一个简单的叙述性介绍。 §4 其他类型的对策论简介 一、完全信息静态对策 该对策是指掌握了参与人的特征、战略空间、支付函数等知识和信息并且参与人同时选择行动方案或虽非同时但后行动者并不知道前行动者采取了什么行动方案。 纳什均衡是一个重要概念。在一个战略组合中,给定其他参与者战略的情况下,任何参与者都不愿意脱离这个组合,或者说打破这个僵局,这种均衡就称为纳什均衡。下面以著名的“囚徒困境”来进一步阐述 例1 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。 在这种情形下,两个囚犯都可以做出自己的选择:或者坦白(即与警察合作,从而背叛他的同伙),或者抵赖(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能抵赖的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人坦白,即告发他的同伙,那么他就可以被无罪释放。而他的同伙就会被按照最重的罪来判决。当然,如果这两个囚犯都坦白,两个人都会被按照轻罪来判决。如图1-1所示。 不过,毕竟多人对策中出现了更多的追求各自利益的独立决策者,因此,策略的相互依存关系也就更为复杂,对任一对策方的决策引起的反应也就要比两人对策复杂得多。并且,在多人对策中还有一个与两人对策有本质区别的特点,即可能存在“破坏者”。所谓破坏者即一个对策中具有下列特征的对策方:其策略选择对自身的得益没有任何影响,但却会影响其它对策方的得益,有时这种影响甚至有决定性的作用。例如有三个城市争夺某届奥运会的主办权。 应该说,非零和对策是最一般的对策类型,而常和对策和零和对策都是它的特例。在非零和对策中,存在着总得益较大的策略组合和总得益较小的策略组合之间的区别,这也就意味着在对策方之间存在着互相配合,争取较大的总得益和个人得益的可能性。 两人零和对策是完全对抗性的,总得益为0,其解法可能性根据矩阵对策予以求解,但在非零和对策下,矩阵对策求解法已经不适用了,下面用例子予以说明。 我们根据得益矩阵来分析。从甲公司立场上看,登有利,不管乙公司如何,保证赢利至少是3,最多是9。如果不登,可能要蒙受损失2。从乙公司的立场上看,同样理由,还是登广告好。但是,这是从理智行为出发的策略,是以彼此不能合作为前提的。上述两公司均采取登广告的策略是稳定的结局。可是,如果彼此能够合作,而都不登广告,免去了广告费,反而各自的赢利要多。在彼此不能合作的情况下,如果甲不登,恰好乙登,甲只好出现败局,这是非理智的策略,带有危险性。因此,非零和对策常常不易获得最理想的答案。对于三个以上的多人零和对策,互相利害关系更加复杂。 习题:P368 习题1 习题3 习题4 * 坦白 抵赖 轻罪,轻罪 重罪,无罪 重罪,无罪 释放,释放 坦白 抵赖 图1-1 囚徒困境 由分析可知,上例中每个囚犯都会选择坦白,因此这个战略组合是固定的,(坦白,坦白)就是纳什均衡解。而这个均衡是不会被打破的,即使他们在坐牢之前达成协议。 囚徒困境反映了个人理性和集体理性的矛盾。对于双方,(抵赖,抵赖)的结果是最好的,但因为每个囚徒都是理性人,他们追求自身效应的最大化,结果就变成了(坦白,坦白)。个人理性导致了集体不理性。 二、完全信息动态对策 在完全信息静态对策中,假设各方都同时选择行动。现在情况稍复杂一些。如果各方行动存在先后顺序,后行的一方会参考先行者的策略而采取行动,而先行者也会知道后行者会根据他的行动采取何种行动,因此先行者会考虑自己行动会对后行者的影响后选择行动。这类问题称为完全信息动态对策问题。 例2 某行业中只有一个垄断企业A,有一个潜在进入者——企业B。B可以选择进入或不进入该行业这两种行动,而A当B进入时,可以选择默认或者报复两种行动。如果B

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档