- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论初步 三、博奕论模型(对策论模型) (一)博奕论或称对策论是指这样一种竞争状况,其中有两个或两个以上的人(厂商)各自追求自身的利益,而任何一方都不能单独决定其结果。 1、零和博弈(不合作博弈) 一个参与者所得是另一个参与者所失。所得与所失之和为零。 例1:参与人:甲、乙;行动或策略:猜硬币;结果:都为正面或都为反面甲输给乙1角,如果是一正一反,甲赢乙1角;报酬:一个1角硬币 (2)不合作博弈 例3:参与人:邦德、詹妮;行动或策略:坦白或抵赖;结果:一方坦白可释放,另一方抵赖判10年,如果都抵赖各判1年,如果都坦白各判8年;报酬:各自刑期的负数 2、纳什均衡 六、囚犯两难困境(prisoners’ dilemma) 囚犯两难困境是博弈论中一个著名的例子,讲的是甲乙两名嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审,双方不能互通消息,每名嫌疑犯都面临坦白和不坦白两种选择。警察告诉他们:在两人都坦白的情况下,各判刑10年;在两人都不坦白的情况下,各判刑3年;在一人坦白另一人不坦白的情况下,坦白的一方会被从轻处罚,只被判刑1年,不坦白的一方则被重判15年。可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果。 1、坦白后不会受到制裁时的情况 此时,双方收益矩阵如下: 如图,在乙不坦白的情况下,如果甲坦白,甲会被从轻处罚,只被判刑1年,乙被重判15年;如果甲也不坦白,由于证据不足,甲乙都只会被判刑3年。 在乙坦白的情况下,如果甲也坦白,甲乙会被判刑10年;如果甲不坦白,乙会被从轻处罚,只被判刑1年,甲则被重判15年。 可见,在乙不坦白的情况下,甲最好是坦白,从而可以被从轻处罚;在乙坦白的情况下,因为被判刑10年总比15年要好,甲最好也是坦白,所以甲会选择坦白。 同理,无论甲如何选择,乙的最好选择也是坦白。结果双方都选择坦白,都被判刑10年。可见,我国公安机关”坦白从宽,抗拒从严“的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中,人人都追求完美反而可能会导致社会变得很糟糕。 2.坦白后会受到制裁时的情况 博弈论的一个重要思想就是规则改变报酬矩阵,改变了报酬矩阵就会影响到行为方式。如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到。这个规则将改变报酬矩阵,新的报酬矩阵如下图所示: 由于坦白后将被灭口,所以收益将是-∝ 。在乙不坦白的情况下,甲最好是不坦白;在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,各自被判刑3年。 第二节??纳什均衡 一、举例 假定A、B两个企业都生产白酒,白酒分为高度和低度两种。报酬矩阵如图所示: 对于B企业来说,A企业如果选择了生产高度白酒,那么B企业会选择生产什么呢?因为800 700 ,所以B企业会选择生产低度白酒。 A企业如果选择了生产低度白酒,因为900 600 ,那么B企业会选择生产高度白酒。 对于A企业来说,如果B企业选择了生产高度白酒,因为1000 600, A企业就会选择生产低度白酒。 如果B企业选择了生产低度白酒,因为900 800, A企业就会选择生产高度白酒。 这里,A企业的决策取决于B企业的决策,同样B企业的决策取决于A企业的决策。但是A企业选择了生产高度白酒以后,只要不变化,B企业就会选择生产低度白酒不变化。反过来也一样,B企业如果选择了生产高度白酒不变化,A企业就会选择生产低度白酒不变化,这实际上是一个纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。 通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。这种均衡最后到底均衡在哪一点,由具体情况决定。在存在帕累托改善的情况下,可能会达到帕累托最优。 在本例中,B企业选择了生产高度白酒,A企业选择生产低度白酒是一种均衡;B企业选择了生产低度白酒,A企业选择生产高度白酒也是一种均衡。由于在B企业选择生产高度白酒,A企业选择生产低度白酒的时候,A、B两企业的收益都比B企业选择生产低度白酒,A企业选择生产高度白酒时的收益要高,存在着帕累托改善,因此最后可能会达到帕累托最优,即B企业选择生产高度白酒,A企业选择生
文档评论(0)