从围棋定式谈什均衡.PDFVIP

下载本文档

13
0
约 19页
2017-09-17 发布于江苏
举报
版权申诉

从围棋定式谈什均衡.PDF

1、本文档共19页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

从围棋定式谈纳什均衡博弈论的基本前提是，某人或某物的行为效果如何，有赖于他人或他物的行为。由于世间的事物很少有不依赖于其他事物而存在的。非合作博弈强调利益的冲突，即非合作甚至对抗状态。 “零和博弈”就是典型的非合作博弈，它是指博弈各方的所得之和为零，在特殊情况下如两人博弈时，一方所得与另一方所失相等。从严格的数学角度来看，围棋 19 ×19 的 361 个交叉点就是围棋对弈者所得的总和，因此围棋棋手非输即赢，可见围棋明显是数学意义上的严格的零和博弈。世事如棋局，而棋局是可以用博弈思维加以概括的。比如过分的“骗着”， “本手”与“缓着”之间，一般都会选择本手，着法过分如不遇反击，可能占到便宜，如遇反击则可能亏损，因此如果棋力相当，则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受方案。围棋定式从策略层面看，如一方的策略是抢占实地，另一方是获得外势，而结果相当，互有所得，双方就愿意那样下。抢占实地考虑现实利益，获得外势考虑将来发展，这便形成一个双方的“均衡”；另一方面，可以从具体行棋效果来看，如果一步棋能考虑到对手各种应手而依然成立，对手也运用同样法则找到应对，则可以说双方达成了“均衡”。在经济学中，均衡(equilibrium)意即相关量处于稳定值。均衡是在分析均衡价格与数量的决定与变动的状况。供需均衡时会达到供需相等，市场出清，也就是在其他条件不变下，会维持不变的状况。一物的供给量等于需求量的价格，就是其均衡价格，对应的数量就是均衡数量。这就是在供给线与需求线相交之处，也称为均衡点。比如在供需分析中，若某一商品的市场价格使得欲购买该商品的人均能买到，同时想卖的人均能将商品卖出去，此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格，产量可称之为均衡产量。均衡分析是经济学中的重要方法。纳什均衡的思想其实并不复杂，在博弈达到纳什均衡时，局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益，于是各方为了自己利益的最大化而选择了某中最优策略，并与其他对手达成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下，倘若有关各方坚持原有的利益最大化原则并理性面对现实，那么这种平衡状况就能够长期保持稳定。再简单一点说，一个策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的收益将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。由此可见，纳什均衡是一稳定的博弈结果。打一个比方，如果把一个乒乓球，放到一个光滑的铁锅里，不论其初始位置在何处，最终乒乓球都会稳定地停留在锅底，这时的锅底就可称为是一个纳什均衡点。相反，如果锅是扣在地上的，那么一个乒乓球很难在锅底部位保持稳定，因为往任何方向的一点点移动，都会使球立刻离开锅底。这时的锅底部位就不是一个纳什均衡点了。博弈的结果并不都能成为均衡。博弈的均衡是稳定的，则必然可以预测。纳什均衡的另一层含义是：在对方策略确定的情况下，每个参与者的策略是最好的，此时没有人愿意先改变或主动改变自己的策略。在上面的“囚徒困境”变形的博弈中，A 和 B 都不坦白就是一个纳什均衡，这对双方来说都是最优选择。同时在这个博弈中，其均衡对双方来说是全局最优的。当然博弈达到纳什均衡，并不一定是对参与者最有利的结果，更不意味着对整体而言是最有利的结果，比如 “囚徒困境”的例子导致了整体的不利。围棋与这个博弈的例子是有所不同的。上面的这个例子是 A 和 B 双方没有信息交换下的博弈，这就是博弈论中的静态博弈概念。围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈，每个参与者都必须向前展望或预期，估计对手的意图，从而倒后推理，决定自己这一步应该怎么走。这是一条线性的推理链：“假如我这么做，他就会那么做———若是那样，我会这么反击”，后面的步骤依此类推。也就是说，你怎么走棋，完全取决于对手的上一招。这在博弈论上叫做“倒推法”。在动态博弈中，存在明显的马太效应