第三章:静态博弈与纳什均衡.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* The prisoners’ dilemma provides insight into the difficulty in maintaining cooperation. 囚徒困境说明了保持合作的困难 Often people (firms) fail to cooperate with one another even when cooperation would make them better off. 即使合作会使它们变好,但是通常人们(企业)却不能互相合作 启示 * 个人理性与集体理性的冲突 “囚徒困境”表明个人理性与集体理性的冲突。 这样的例子很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给等等; 许多的制度就是为解决“囚徒困境”而存在的; * 公共产品(public goods) 提供 不提供 提供 不提供 4,4 -1,5 5,-1 0,0 无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供) * 公共产品与税收制度 税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境” 比较私人产品与公共产品的不同:使用上排他性; 私人产品是自愿购买的,但公共产品可能需要强制购买; * “囚徒困境”的一般表示 满足:RTPS; (S+R)T+T -8, -8 0, -10 -10, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 两个罪犯的得益矩阵 囚徒 2 囚 徒 1 T, T S, R R,S P,P 合 作 不合作 合 作 不合作 * 用法律解决“囚徒困境” 合作 不合作 合作 不合作 T,T S,R-X R-X,S P,P 满足:XR-T(不合作带来的诱惑 ) * “智猪博弈”(boxed pigs) 有些博弈没有占优均衡,但通过剔除“坏”战略,我们可以预测博弈的结果。如“智猪博弈” 按 等待 按 等待 3,1 2,4 7,-1 0,0 按按钮的猪 吃到的猪食数量 大猪 小猪 大猪 4单位 4单位 小猪 7单位 1单位 两猪同时 5单位 3单位 * 重复剔除占优均衡 Iterated elimination of strictly dominated strategy的思路:首先找出博弈参与人的劣战略(dominated strategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。 如果这样的解存在,我们说该博弈是“重复剔除占优可解的”(iterated dominance solvable). * 纳什均衡(Nash Equilibrium) 纳什均衡是指每个博弈参与人都确信,在给定其他参与人战略策略决定的情况下,他选择了最优战略。 JOHN F.NASH 占优战略均衡一定是纳什均衡。在重复剔除的占优战略均衡中,最后剩下的唯一战略组合也一定是纳什均衡。 * 通俗理解 纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。 * 哲学思考 如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。 * 纳什均衡与一致预期 一致预期:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。 基于信念的选择是合理的;支持选择的信念是正确的; * 寻找纳什均衡 C1 C2 C3 R1 R2 R3 100,100 0,0 50,101 50,0 1,1 60,0 0,300 0,0 200,200 * 练习:警察抓小偷 在十字路口,小偷选择逃往左还是右边。警察到达时不知道小偷逃跑方向。他只能选择追过去还是不追。警察能否抓到小偷完全取决于开始追的方向是正确还是错误,如果开始追对了方向则能追到小偷,反之则不能。如果警察停止追小偷他的支付为零,如果抓到小偷则支付为1,而如果追了没有追到支付为-1。小偷被抓到则支付为-1,而没有抓到为1。请写出该博弈的战略式。(策略型表述标准式) * KEY 0, 0 -1, 1 1, -1 0, 0 1 , - 1 -1, 1 不追 左追 右追 警察 左逃 右逃 小 偷 * 练习:下雨带伞 丈夫和妻子必须独立决定出门是否带伞,下雨和不下雨的概率相同。每个人的支付规则相同,如果下雨,

文档评论(0)

微微 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档