网站大量收购闲置独家精品文档,联系QQ:2885784924

石头,剪刀,布 - 三人博弈.pptx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
石头,剪刀,布 - 三人博弈

(一)“石头,剪刀,布”游戏 (Rock, Scissor,Paper);(二)著名的“囚徒困境” (Prisoners’Dilemma);想想: 他们会如何选择,最终的决策结果会是什么?;将双方的具体选择和相应的结果描述如下:;博弈与决策: 博弈是建立在相互猜测对方的决策过程基础上的决策,即是“互动性”的决策。 博弈论是建立在理性人的假设基础之上(理性人一般是指主体所追求的唯一目标是自身经济利益的最大化),?博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,被广泛应用到经济活动和其他社会科学领域当中。;GameTheory;局中人(Players):可以是个人也可以是团体、组织等,在博弈论中假定局中人是理性人。 行动空间(Action space):每个局中人都有一行动集,而每个人在自己的行动集当中的选择所构成的一组策略,被称为行动空间,即上述 A。 盈利函数(效用函数 Payoff function):指局中人从博弈中获得的效用水平,大多是数值型的,来表示自己在一局博弈当中的盈利。显然,它是A的函数,并且满足线性变换。 ;( Rock,Scissor,Paper );( Rock,Scissor,Paper );?;?;局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等价于最大化自己的期望效用,因为是零和博弈),根据二人零和博弈理论,1和2的决策问题变为: ;在博弈理论中,纳什均衡是一个非常重要的概念,它表达了博弈的基本原理,我们简单地给出它的定义:;?;LINGO程序如下:;运行结果:;1.我们可以这么理解该游戏的混合战略,当每个人以同等的概率随机的选择时,他们认为这三个行动一样好,即没有对哪个的偏好,此时对于对方的选择,你选择哪一个行动所获得的期望效用是相同的,所以你选择哪个是无差别的。 2.对于该游戏,我们选取的效用函数构成了零和博弈(Zero-Sum Game),但是如果局中人的效用之和不为零,我们不能根据最小最大定理简单地去分析和计算,但是我们可以根据纳什均衡的定义去求解。;我现在要求是三个人玩呢?;拆分成三个二维矩阵:对于某一局中人1有;2 3;?;进一步分析: 局中人的选择和盈利是对称的,所以我???考虑的局中人1怎么选让自己的盈利最大,对于2和3也是一样的;当然,也可以用MATLAB 去求解,运行结果跟前面的理论分析是一样的,截图如下:;?;拓展问题: 假定三人游戏中,任意两人可以组成联盟呢,如果是多人呢? 给出一种情况:

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档