网站大量收购闲置独家精品文档,联系QQ:2885784924

电子课件第七章.ppt

  1. 1、本文档共120页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章 对 策 论 内容提要 ? 对策模型中的基本要素 ? 矩阵对策(两人有限零和对策)的纯策略 ? 矩阵对策的混合策略 ? 求解矩阵对策的方法 7.1 引言 对策论也叫做博弈论。 “博弈”一词的英文单词是Game,意为对策、游戏等;因此,一谈到博弈,人们自然会想到游戏。对策论的早期思想也确实源于游戏。在诸如下棋、打牌、划拳等游戏中,人们要解决的问题是如何才能获胜。这实际上是当事人面对一定的信息量寻求最佳行动和最优策略问题。 7.1 引言 在实际生活中,许多游戏都反映了对策论的思想。例如,在人们非常熟悉的“石头、剪刀、布”的游戏中,我们的问题是:对方如何行动,而我又将如何应对才能取得胜利?这实际上就涉及到了对策论的核心问题,即对策论以对方的行为作为自己决策的依据,并寻求最佳。但对策论不仅仅是指游戏,它研究的是当人们的行为存在相互作用时的策略行为及其后果。社会生活中的许多现象,都带有相互竞争与合作的特征,可以说,一切都在博弈或对策之中。 7.2 对策模型的基本要素 为了对对策问题在数学上进行分析,需要建立对策问题的数学模型,称之为对策模型。根据所研究问题的性质的不同,可建立不同的对策模型。不论模型在形式上有何不同,但模型都必须包括以下几个基本要素。 7.2 对策模型的基本要素 1.局中人 在一个对策行为中,有权决定自己行动方案的对策参加者被称为局中人。一般要求一个对策中至少有两个局中人。局中人的集合用字母I表示。 7.2 对策模型的基本要素 局中人除了理解为个人外,还可以理解为集体(如球队、交战国、企业公司等),也可以把大自然理解为局中人(因为人类经常处于和大自然的斗争状态中);另外,还假定局中人都是聪明的,有理智的。 7.2 对策模型的基本要素 同时,为使所研究的问题更加清晰,把那些利益完全一致的参加者们看做一个局中人,因为他们利害一致,必使他们齐心合力,相互配合行动如一个人。例如,桥牌游戏中,东西双方利益一致,南北两面得失相当,所以虽有四人参加,只能算有两个局中人。我们称只有两个局中人的对策现象为“两人对策”(如象棋、桥牌),而多于两个局中人的对策称为“多人对策”。另外,根据局中人之间是否允许进行合作,还可有“结盟对策”和“不结盟对策”等。 7.2 对策模型的基本要素 2.策略 一局对策中,每个局中人都有供他选择的实际可行的完整的行动方案。此方案不是某一步的行动方案,而是指导自始至终如何行动的一个方案。局中人一个可行的自始至终通盘筹划的行动方案,称为这个局中人的一个策略。而把这个局中人的策略全体,称做这个局中人的策略集合。 7.2 对策模型的基本要素 例如,在下象棋中“当头炮”只作为某一个策略的组成部分,而并非一个策略。在齐王与田忌赛马的例子中,如果一开始就要把各人的三匹马排好次序,然后依次出赛。那么,三匹马排列的一个次序就是一个完整的行动方案,于是被称为一个策略。例如,用“上、中、下”表示首先是上马出赛,其次是中马出赛,最后是下马出赛这样一个策略。显然,各局中人都有6个策略,即 7.2 对策模型的基本要素 ① 上、中、下;② 上、下、中;③ 中、上、下;④ 中、下、上;⑤ 下、中、上;⑥ 下、上、中。 这个策略全体就是局中人的策略集合。 如果在一局对策中,各个局中人都有有限个策略,则称之为“有限对策”(齐王与田忌赛马就是一个有限对策);否则称之为“无限对策”。 7.2 对策模型的基本要素 3.局势集合 在对策过程中,从每个局中人的策略集合中各取一个策略,所组成的策略组称做“局势”,可能产生的各种局势的全体,被称为局势集合。局势集合用字母Ω表示。在某些局势下对局结束,这种局势称为最终局势。 7.2 对策模型的基本要素 4.收益函数 一局对策结束之后,对每个局中人来说,不外乎是胜利或失败,名次的前后,以及其他物质的收入或支出等,这些可以统称之为“得失”或“益损”。 在齐王与田忌赛马的例子中,最后田忌赢得1千金,而齐王损失1千金,即为这局对策(结局时)双方的“得失”。 7.2 对策模型的基本要素 实际上,每个局中人在一局对策结束时的得失,与局中人所选定的策略有关。例如,上述赛马的例子中,当齐王出策略“上、中、下”,田忌出策略“下、上、中”时,田忌得千金;而如果齐王与田忌都出策略“上、中、下”时,田忌就得付出三千金了。所以用数学语言来说,一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数。通常称为

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档