博弈论和竞争策略.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课堂游戏(一) 三个火枪手 课堂游戏(二) “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” ——保罗·萨缪尔森 博弈论导论—现代博弈论简单发展史 起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》 博弈论导论—博弈论和诺贝尔经济学奖 1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten) 博弈论导论—博弈论和诺贝尔经济学奖 2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz) 博弈论导论 标准式博弈与扩展式博弈 : 矩阵 树形 博弈论导论 每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。 同步,一次博弈--标准式博弈 构成标准式博弈的要素有: 参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 标准式博弈:均衡分析 假设参与者1认为参与者2选择 “A” 标准式博弈:均衡分析 则参与者1应该选择 “a” 参与者1对 “A”的最优反应是 “a”. 标准式博弈:均衡分析 假设参与者1认为参与者2选择 “B”. 标准式博弈:均衡分析 则参与者1应该选择 “a”. 参与者1对 “B”的最优反应是 “a”. 标准式博弈:均衡分析 如果参与者1认为参与者2选择 C… 参与者1对“C”的最优反应是“a”. 占优策略 不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略 站到对手的立场上,想 参与者2会怎么做呢? 结果 关键点: 寻找占优策略 检查一下你是否存在占优策略,如果有,就选择占优策略 站在对手的位置上思考问题 如果你没有占优策略,那么从你对手角度考虑博弈。如果对手有占优策略,预期他将按占优策略行动 纳什均衡 我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的 同步,一次博弈的应用 专栏的博弈分析(制药公司销售大战) 囚徒困境 彩电价格大战 公共地悲剧 公共产品的供给 如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。 军备竞赛 两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。 经济改革 经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。 位置博弈 智猪博弈 关键点 处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会 股市中的机构大户与散户 新产品研发与中小企业 可口可乐、百事可乐与非品牌软饮料产品(Scott) 小狗策略 大智若愚中的智慧 贫困县的教育拨款 协调博弈 关键点 不是所有的博弈都涉及到利益冲突. 沟通能够帮助解决协调问题. 顺序行动能够帮助解决协调问题. 先动优势的作用 重复博弈--广告博弈 两个企业 (Kellogg’s General Mills) 的经理想最大化利润 策略是广告活动 同步博弈 一次博弈 无限重复博弈 有限重复博弈 一次广告博弈 一次广告博弈的均衡 如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗? 密歇根大学爱克斯罗德教授的计算机模拟 他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”,根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示,“一报还一报” 的简单策略获得第一。之后,又有63位科学家递交了改进的程序,进行第二轮竞赛,其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是,第二轮比赛的优胜者仍然是“一报还一报”。 触发策略 “如果对手在过去没有做过广告,我就不做;一旦对手作广告,自此以后,我就用高强度的广告活动来惩罚他” 事

文档评论(0)

bhyq + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档