网站大量收购独家精品文档,联系QQ:2885784924

石头,剪刀,布三人博弈精读.pptx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(一)“石头,剪刀,布”游戏 (Rock, Scissor,Paper) 思考: 双方应该怎么选择才是最优的? 是否存在绝对致胜的方法? 我们总是在选择自己的战略前试图猜中对手的行动选择;同时,我们又会力图避免自己的选择被对方猜中,还要根据自己对对方行动的事前预测来做出最优的行动选择,即这样的游戏行动选择带有随机性。 (二)著名的“囚徒困境” (Prisoners’Dilemma) 假设有两个小偷联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行单独审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两人都认罪,则各被判刑8年。 如果一人认罪,另一人不认,则认罪者立即释放,不认罪者加重判刑至10年。如果两人都不认罪,则警方因证据不足不能判两人有罪,但可以因私入民宅的罪名将两人各判入狱一年。并且,每个小偷都被告知,他的同伙也面对着同样的政策。 想想: 他们会如何选择,最终的决策结果会是什么? 分析: 这个模型有如下要素: 1.两个小偷必须在不知道对方的选择的情况下独立进行自己的决策 2.双方都会为自己的利益考虑,即使自己的盈利最大化 将双方的具体选择和相应的结果描述如下: -8 -8 0 -10 -10 0 -1 -1 2 认罪 不认罪 认罪 1 不认罪 对1来说无论2选择什么,他选择‘认罪’总是最优的,根据对称性,对于2,‘认罪’也是最优的,所以模型的最终选择结果是(认罪,认罪) 但是,实际上,显然(不认罪,不认罪)是对双方最好的结果。 所以,在个人理性与集体理性之间存在不一致性。 我们假定两个小偷都只在乎各自的刑期,且盈利等于刑期的相反数 博弈与决策: 博弈是建立在相互猜测对方的决策过程基础上的决策,即是“互动性”的决策。 博弈论是建立在理性人的假设基础之上(理性人一般是指主体所追求的唯一目标是自身经济利益的最大化),?博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,被广泛应用到经济活动和其他社会科学领域当中。 上述两个例子,其实都可以被描述为一局博弈,而且都是二人博弈(只有两个参与者),其中隐含了时间的动态性质,被称为静态战略式博弈。 下面我们给出博弈模型的战略式数学描述 GameTheory 局中人(Players):可以是个人也可以是团体、组织等,在博弈论中假定局中人是理性人。 行动空间(Action space):每个局中人都有一行动集,而每个人在自己的行动集当中的选择所构成的一组策略,被称为行动空间,即上述 A。 盈利函数(效用函数 Payoff function):指局中人从博弈中获得的效用水平,大多是数值型的,来表示自己在一局博弈当中的盈利。显然,它是A的函数,并且满足线性变换。 ( Rock,Scissor,Paper ) 0 0 1 -1 -1 1 -1 1 0 0 1 -1 1 -1 -1 1 0 0 2 石头 剪刀 布 石头 剪刀 布 ( Rock,Scissor,Paper ) 显然,从支付矩阵上看,不存在一个对双方都是最优的决策,但是无论双方的选择是什么,各自的效用函数之和总是为零。这样的博弈称为二人零和博弈 那么我们怎么选择才能使自己的盈利最大呢?既然,局中人的行动具有随机性,我们对每一行动选择赋予概率,组成该博弈的混合战略。 局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等价于最大化自己的期望效用,因为是零和博弈),根据二人零和博弈理论,1和2的决策问题变为: 在博弈理论中,纳什均衡是一个非常重要的概念,它表达了博弈的基本原理,我们简单地给出它的定义: 对二人博弈,用计算机求解纳什均衡常用的Lemke-Howson算法主要运用下述定理: LINGO程序如下: model: sets: k/1..3/:p; n/1..3/:q; pay(k,n):Ma,Mb; endsets data: Ma=0 1 -1 -1 0 1 1 -1 0; Mb=0 -1 1 1 0 -1 -1 1 0; enddata va=@sum(pay(i,j):Ma(i,j)*p(i)*q(j)); vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j)); @for(k(i): @sum(n(j):Ma(i,j)*q(j))=va );

文档评论(0)

知识宝库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档