- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从围棋定式谈纳什均衡
博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世
间的事物很少有不依赖于其他事物而存在的。非合作博弈强调利益的冲突,即非合作甚至对
抗状态。
“零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下
如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋 19 ×19 的 361
个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上
的严格的零和博弈。世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,
“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇
反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追
求利益中不可能占尽便宜。这就导致双方都能接受方案。
围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当,互有
所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成一个
双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手
而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。
在经济学中,均衡(equilibrium)意即相关量处于稳定值。均衡是在分析均衡价格与数量的决
定与变动的状况。供需均衡时会达到供需相等,市场出清,也就是在其他条件不变下,会维
持不变的状况。
一物的供给量等于需求量的价格,就是其均衡价格,对应的数量就是均衡数量。这就是
在供给线与需求线相交之处,也称为均衡点。比如在供需分析中,若某一商品的市场价格使
得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了
均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重
要方法。
纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能
因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优
策略,并与其他对手达成了某种暂时的平衡。
这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面
对现实,那么这种平衡状况就能够长期保持稳定。
再简单一点说,一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略
时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什
均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个光滑
的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就可称
为是一个纳什均衡点。
相反,如果锅是扣在地上的,那么一个乒乓球很难在锅底部位保持稳定,因为往任何
方向的一点点移动,都会使球立刻离开锅底。这时的锅底部位就不是一个纳什均衡点了。
博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层
含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或
主动改变自己的策略。
在上面的“囚徒困境”变形的博弈中,A 和 B 都不坦白就是一个纳什均衡,这对双方
来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳
什均衡,并不一定是对参与者最有利的结果,更不意味着对整体而言是最有利的结果,比如
“囚徒困境”的例子导致了整体的不利。
围棋与这个博弈的例子是有所不同的。上面的这个例子是 A 和 B 双方没有信息交换下
的博弈,这就是博弈论中的静态博弈概念。
围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,
每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该
怎么走。
这是一条线性的推理链:“假如我这么做,他就会那么做———若是那样,我会这么反
击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招。这在博弈
论上叫做“倒推法”。
在动态博弈中,存在明显的马太效应
文档评论(0)