生活中的博弈第一章导论.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生活中的博弈第一章导论

(3)博弈的基本概念或要素 ①决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。 ②对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。 (3)博弈的基本概念或要素 ③局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。 ④策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)博弈的基本概念或要素 ⑤得失(payoffs):一局博弈的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。 ⑥次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 ⑦信息:参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 (3)博弈的基本概念或要素 ⑧均衡:在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。简单点说,均衡是所有参与人的最优战略或行动的组合。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略其支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。 纳什均衡点存在性的前提 纳什均衡点存在性证明的前提是“博弈均衡偶” 。 所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 “均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≥偶对(a*,b)。 纳什均衡点存在性的前提 如果是非零和博弈:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略 b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。 根据上述定义,可以得到纳什定理:   任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 囚徒困境的描述 两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招认犯罪,警方并无充足证据将其按罪判刑。警方将其关入不同牢室,并对他们说明不同行动带来的后果。如果两个人都不坦白,将均被判为轻度犯罪,入狱一个月;如果双方都坦白,都将被判入狱6个月;最后,如果一个人招认而另一人拒不坦白,招认的一方马上获释,而另一人将判入狱9个月——所犯罪行6个月,干扰司法加判3个月。 设定: (1)每个局中人都知道博弈规则和博弈结果的支付矩阵; (2)每个局中人都是理性的(个人理性和个人最优决策); (3)不能“串通” 囚徒困境的分析 通过上矩阵观察可以发现: 每个囚徒都有两种战略:坦白或不坦白; 每一格的两个数字代表对应战略组合下两个囚徒的支付(效应); 其中第一个数字是囚徒1的支付(即行);第二个数字是囚徒2的支付。 纳什均衡是(坦白,坦白):给定囚徒2坦白的情况下,囚徒1的最优战略是坦白;同样,给定囚徒1坦白的情况下,囚徒2的最优战略也是坦白。事实上,(坦白,坦白)不仅是纳什均衡,也是占优战略均衡,即不管对方如何选择,个人最优均是坦白。 囚徒困境的思考 反应了个人理性与集体

文档评论(0)

cgtk187 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档