- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
对于二人常数和对策,仍然有鞍点对策,其求解方法与二人零和对策相同。所谓常数和对策是指局中人A和局中人B所赢得的值之和为一常数.显然,二人零和对策是二人常数和的特例,即常数为零。对于二人常数和对策,有纯策略对策和混合策略对策。其求解方法基本上是相同的。0103021.鞍点对策1.2二人常数和对策例9.4 在晚8点至9点这个时段,两家电视台在竞争100万电视观众收看自己的电视节目,并且电视台必须实时公布自己在下一时段的展播内容。电视台1可能选择的展播方式及可能得到的观众如表所示。电视台min西部片连续剧喜剧片电视台1西部片35156015连续剧45585045喜剧片38147014max455870对于常数和对策,也存在混合对策,同样可以采用线性规划方法求解,这里就不举例子了。解:事实上,对方得到的,就是自己失去的,完全利用二人零和的方法确定最优纯策略,即因此,电视台1选择播放连续剧,赢得45万观众,电视台2播放西部片,赢得100-45=55万观众。0103022.混合对策2二人非常数和对策二人非常数和对策也称为双矩阵对策。在前面介绍的常数和(零和)对策中,均包含两种情况,纯策略和混合策略。对于非常数对策,也包含这两种策略。纯对策问题例9.6:囚徒的困境(表9.2.1)乙坦白不坦白甲坦白(-3,-3)(0,-10)不坦白(-10,0)(-1,-1)设有甲、乙两名嫌疑犯因同一桩罪行被捕,由于希望他们坦白并提供对方的犯罪证据,规定如两人均坦白各判刑3年;如上方坦白另一方不坦白,坦白一方从轻释放,不坦白一方判刑10年;如两人均不坦白,由于犯罪事实很多不能成立,只能各判1年,见表9.2.1所示。A试分析甲、乙两犯罪嫌疑人各自采用什么策略使自己的刑期最短。B例9.6例9.6给出了典型的二人非常数和对策,每人的收益矩阵是不相同的,因此称为双矩阵对策。01通常规定,双矩阵中,第一个元素是局中人A的赢得值,第二个元素是局中人B的赢得值。02问题分析:这是一个二人非常数和对策问题。从表面看,两犯罪嫌疑人拒不坦白,只能被判1年徒刑,结果是最好的。03但仔细分析,确无法做到这一点。因为犯罪嫌疑人甲如果采用不坦白策略,他可能被判的刑期为1到10年,而犯罪嫌疑人乙可能判的刑期为0到1年。04而甲选择坦白,他被判的刑期为0到3年,此时,犯罪嫌疑人乙可能判的刑期为3到10年。因此,犯罪嫌疑人甲一定选择坦白。1基于同样的道理,犯罪嫌疑人乙也只能选择坦白。2选择坦白是他们最好的选择,各自被判3年。3事实上,设(cijA,cijB)是甲、乙赢得值,则甲、乙采用的策略是0102按照上面的论述,对于一般纯对策问题,局中人A、B的支付(赢得)矩阵由表9.2.2所示。1.纯对策问题的基本概念局中人A、B的支付矩阵β1β2…βnα1…α2…┆┆┆┆αm…为局中人A的支付(赢得)矩阵,01G={A,B;S1,S2,CA,CB}或G={S1,S2,CA,CB}04为局中人B的支付(赢得)矩阵。02因此,矩阵对策记为:03定义9.5:设G={S1,S2,CA,CB}是一双矩阵对策,若等式成立,则记vA=,并称vA为局中人A的赢得值,记vB=,并称vB为局中人B的赢得值,称(αi*,βj*)为G在纯策略下的解(或Nash平衡点),称αi*和βj*分别为局中人A、B的最优纯策略。纯对策问题的求解方法01例:9.7(夫妻周末安排问题)一对夫妻,商量周末安排。丈夫喜欢看足球,妻子喜欢听音乐会。他们的赢得值由表9.7所示。请为这对夫妻设计最好的度周末的方案。03实际上,定义9.5也同时给出了纯对策问题的求解方法。因此,对于例9.6,((1,0),,(1,0))是Nash平衡点,也就是说,坦白他们的最佳策略。再看一个例子。02解:由定义9.5可知,对于策略((1,0),(1,0))或策略((0,1),(0,1))均是Nash平衡点,也就是最优解,即他们选择是共同看足球,或共同听音乐会。表中带有下划线是他们采用策略的赢得值。妻足球音乐会夫足球(3,1)(-1,-1)音乐会(-1,-1)(1,3)STEP1STEP2STEP3如果不存在使式(18)成立的对策,则需要求混合对策。类似于二人常数和对策情况,需要给出混合对策的最优解。混合对策问题的基本概念定义9.6在对策G=\{S1,S2,CA,CB}中,若存在策略对使得2.混合对策问题1则称
文档评论(0)