博弈论和竞争策略.ppt

下载文档 降价啦

4
0
约9.27千字
约 72页
2017-08-27 发布于安徽
举报
版权申诉
保障服务

博弈论和竞争策略.ppt

1、本文档共72页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

课堂游戏（一）三个火枪手课堂游戏（二） “要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解” ——保罗·萨缪尔森博弈论导论—现代博弈论简单发展史起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》博弈论导论—博弈论和诺贝尔经济学奖 1994：纳什（Nash）、海萨尼（J.Harsanyi）、泽尔腾（R.Selten）博弈论导论—博弈论和诺贝尔经济学奖 2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）博弈论导论标准式博弈与扩展式博弈 : 矩阵树形博弈论导论每一个博弈都是一个你中有我，我中有你的情形，不同的博弈参与者可以选择不同的行动，但由于相互作用，一个博弈参与者的得益不仅取决于自己采取的行动，也取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考，即在选择你的行动时还是考虑你的得益，但是你应当用他人的得益去推测他人的行动，从而选择最有利于自己的行动。同步，一次博弈--标准式博弈构成标准式博弈的要素有: 参与者：参加博弈并做出决策的个体策略：参与者可能采取的行动得益：参与者采取不同策略带来的利益或损失标准式博弈:均衡分析假设参与者1认为参与者2选择 “A” 标准式博弈:均衡分析则参与者1应该选择 “a” 参与者1对 “A”的最优反应是 “a”. 标准式博弈:均衡分析假设参与者1认为参与者2选择 “B”. 标准式博弈:均衡分析则参与者1应该选择 “a”. 参与者1对 “B”的最优反应是 “a”. 标准式博弈:均衡分析如果参与者1认为参与者2选择 C… 参与者1对“C”的最优反应是“a”. 占优策略不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略（上策）不管对手做什么，对一个参与者都能获得最高得益的策略站到对手的立场上，想参与者2会怎么做呢? 结果关键点：寻找占优策略检查一下你是否存在占优策略，如果有，就选择占优策略站在对手的位置上思考问题如果你没有占优策略，那么从你对手角度考虑博弈。如果对手有占优策略，预期他将按占优策略行动纳什均衡我所做的是：给定你所做的，我所做的是最好的；你所做的是：给定我所做的，你所做的是最好的同步，一次博弈的应用专栏的博弈分析（制药公司销售大战）囚徒困境彩电价格大战公共地悲剧公共产品的供给如果大家都出钱兴办公用事业，所有人的福利都会增加。问题是，如果我出钱你不出钱，我得不偿失，而如果你出钱我不出钱，我就可以占你的便宜。所以每个人的最优选择都是“不出钱”，结果使所有人的福利都得不到提高。军备竞赛两国都不搞军备竞赛，都把资源用于民用，两国福利都变好。但由于都怕受威胁而大搞军备竞赛，结果两国福利都变得更糟。经济改革经济改革要付出成本（包括风险），而改革的成果大家享受，结果是，尽管人人都认为改革好，却很难有人真正去改革，大家只好在都不满意的体制下继续生活下去。位置博弈智猪博弈关键点处于强势的参与者为维护自己利益采取某种决策时，为其他弱势参与者提供了搭便车的机会股市中的机构大户与散户新产品研发与中小企业可口可乐、百事可乐与非品牌软饮料产品（Scott）小狗策略大智若愚中的智慧贫困县的教育拨款协调博弈关键点不是所有的博弈都涉及到利益冲突. 沟通能够帮助解决协调问题. 顺序行动能够帮助解决协调问题. 先动优势的作用重复博弈--广告博弈两个企业 (Kellogg’s General Mills) 的经理想最大化利润策略是广告活动同步博弈一次博弈无限重复博弈有限重复博弈一次广告博弈一次广告博弈的均衡如果企业每年都进行这种一次博弈，并且永远进行下去，这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下，共谋起作用吗？密歇根大学爱克斯罗德教授的计算机模拟他首先邀请全世界的学者递交自认为最优的策略程序，然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”，根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示，“一报还一报” 的简单策略获得第一。之后，又有63位科学家递交了改进的程序，进行第二轮竞赛，其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是，第二轮比赛的优胜者仍然是“一报还一报”。触发策略 “如果对手在过去没有做过广告，我就不做；一旦对手作广告，自此以后，我就用高强度的广告活动来惩罚他” 事