完全信息静态博弈和其纳什均衡解.docxVIP

完全信息静态博弈和其纳什均衡解.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE \* MERGEFORMAT10 第三章 完全信息静态博弈及其纳什均衡解 完全信息静态博弈 定义 3.1.完全信息静态博弈。完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。 两个特点:(1)静态;(2)完全信息。 完全信息静态博弈例子。 例1:锤子-剪刀-布 例2:交通行驶 甲 乙左右左1,10,0右0,01,1 非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。 纳什均衡及其判定 定义3.2 纳什均衡。在一个n人博弈的标准式G={S1,S2,…,Sn; u1,u2,…,un}中,一个策略组合{s1*,s2*,…,sn*},若满足ui(s1*,…,si*,…sn*)≥ui(s1*,…si,…,sn*)(i=1…n),则称这个策略组合为{s1*,s2*,…,sn*}为该博弈G的一个纳什均衡。 某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。 特点:(1)每个人没有单独改变策略的动机;(2)局部最优。 纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。 求解纳什均衡的方法: (1)剔除严格被占优策略。 例3:囚徒困境 甲 乙不合作合作不合作2,21,4合作4,13,3缺点:只有当仅有一个纯策略均衡点的时候,该方法才是有效的。 (2)用定义来求解 (3)对于策略空间为连续的博弈,用求极值的方法来求得。 纳什均衡存在定理: (纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,Sn; u1,u2,…,un}中,如果n是有限的,且对每个i, Si是有限的,则博弈至少存在一个纳什均衡。这里的均衡可能包含混合策略均衡。 证明:略 例子3:囚徒困境的均衡 例1:“锤子-剪刀-布”的均衡? 甲 乙锤子剪刀布锤子0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0 混合策略与混合策略的均衡 纯策略与混合策略概念。 定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{si1,si2,…,sik},则参与人i在策略空间上的一个概率分布pi=(pi1,pi2,…,pik)构成他的一个混合策略,其中pi1+pi2+…+pik=1。 如:在取经的过程中猪八戒的策略空间为{西天取经,散伙(回高老庄)},“采取西天取经”(或“采取回高老庄”)是纯策略。而“70%的可能性采取西天取经、30%的可能性回高老庄”为猪八戒的一个混合策略。沙僧采取纯策略(西天取经);而孙悟空也在采取混合策略,只不过“西天取经”的概率比较高。由此可见,这里的混合策略中的概率分布体现了参与人采取某个策略的意志或忠诚程度。 混合策略体现了参与人选择纯策略的不确定性,它的引入使博弈有完美的数学解。然后,该概念自上世纪80年代一直被人们认为“直觉上有问题的”。混合策略的核心是随机性。但它缺乏支持:人们怎么会通过投掷骰子来进行选择呢?人们不会随身带着随机发生器。 三个解释:第一, HYPERLINK /wiki/Ariel_Rubinstein \o Ariel Rubinstein Ariel Rubinstein(1991)解释说,它反映我们对参与人的信息和进行决策的过程没有足够的知识;但这种解释不令人满意。第二,想象一个参与人群体。混合策略反映被选择的纯策略的分布;但这种解释不能说明个体进行这样选择时的选择。第三, Aumann and Brandenburger (1995)将纳什均衡重新解释成信念中的均衡而不是行动中的均衡:参与人对其他人采取各个策略的可能性的信念。这种解释弱化了纳什均衡的解释力,因为这是可能的:在这样的均衡中每个参与人实际上采取纯策略。 混合策略均衡案例: 例4.田忌赛马 分析: 田忌每次均输,是因为他采取了纯策略,对方也采取了纯策略——不是均衡点(表中的对角线上的点); 田忌改变策略,采取了孙膑的方法,偏离均衡点,此时,在对方不改变策略的情况下收益提高,而获胜。此点(如图中*标明的点)是均衡点吗? 均衡策略是什么? 齐王 田忌上中下上下中中上下中下上下上中下中上上中下-3,3-1,1-1,11*,-1*-1,1-1,1上下中-1,1-3,31,-1-1,1-1,1-1,1中

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档