博弈论第四讲动态博弈.pptVIP

下载本文档

0
0
约8.96千字
约 58页
2024-12-26 发布于北京
举报
版权申诉

博弈论第四讲动态博弈.ppt

1、本文档共58页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

结论在动态博弈中，各个博弈方的选择和博弈的结果，与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大的关系。虽然，有些博弈方很想或声称要采取特定的行动，以影响或制约对方的行为，但如果这些行为缺乏以经济利益为基础的可信性，那么这些许诺或威胁就不会有真正的效力，只能落空。纳什均衡问题第三种开金矿博弈中，（乙：不借-不打，甲：不分）和（乙：借-打，甲：分）都是纳什均衡。为什么？因为给定对方的策略，双方的策略都是符合自己最大利益的最佳策略，单独偏离对自己都是不利的如给定乙的第一、第三选择，“借，打”，甲在第二阶段选择分，也是最符合自己利益的，否则不分导致法律纠纷得不偿失。但为什么后者与事实矛盾呢？后者有一个不可信的威胁（乙），不可能实现或稳定，不能成为预测博弈结果的基础而甲掌握乙的弱点，不理睬乙的打官司的威胁；乙也不会想靠一个明显不可信的威胁撑腰，冒险将资金借给甲纳什均衡的问题结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题引子如何来求解动态博弈呢？上面我们已经对开金矿的几个版本进行了正确的分析，排除了不可信的许诺和威胁，从而也得出正确结论之所以能做到这一点，关键：采用了动态博弈分析最重要、基本的方法逆推归纳法逆推归纳法定义：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。思路：先行为的一方，必然会考虑到后行为博弈方在后面阶段中如何选择行为，只有在博弈的最后一阶段选择，不再有后续阶段的选择牵制，才能直接作出明确选择举例121（2，0）（5，0）（4，2）（1，1）UDRLU’D’乙不借借（0，1）甲不分分（4，0）（2，2）乙甲乙打（2，2）不分分不借借（4，0）（0，-1）不打（0，1）乙不借借（0，1）（4，0）法律保障不足的开金矿博弈引子由于逆推归纳法确定的各博弈方各阶段的选择都是建立在后续阶段各个博弈方理性选择的基础上，所以自然排除了包含不可信的威胁或许诺的可能性，因此其得出的结论比较可靠，确定的各个博弈方的策略组合是有稳定性的。由于纳什均衡不能排除不可信的行为选择，不是真正具有稳定性的均衡，因此需要发展纳什均衡，使其排除不可信行为选择，以满足动态博弈需要。泽尔腾1965年提出了“子博弈精炼纳什均衡”来满足动态分析需要精炼纳什均衡（perfectNE)不包含不可置信的行动的策略所组成的纳什均衡被称为“精炼纳什均衡”；也就是说，不论过去发生了什么，构成精炼纳什均衡的策略，其所规定的行动在每一个决策点上都是最优的。所以，又称为“序贯均衡”(sequentialequilibrium);精炼纳什均衡：（1）在原博弈是一个纳什均衡；（2）在每一个子博弈上都是纳什均衡。子博弈精炼纳什均衡定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈精炼纳什均衡”。子博弈精炼纳什均衡能够排除均衡策略中不可信的威胁和许诺，使得我们可以更合理地对博弈中参与人行为的预测；它因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈精炼纳什均衡的基本方法。均衡路径与非均衡路径精炼纳什均衡下所经过的决策点和最优选择构成的路径，称为均衡路径（equilibriumpath);其他的路径是非均衡路径（off-equilibriumpath);均衡结果依赖于非均衡路径上的选择：1只所以一开始就选择U，是因为他预期如果选择D的话，2将选择L；而2只所以选择L，是因为她预期如果选择R的话，1将选择U’。精炼均衡与理性共识逆向归纳的过程实际上就是重复剔除劣策略的过程，其前提是博弈规则和理性共识：每个人是理性的，每个人知道每个人是理性的，如此等等。因此，精炼纳什均衡的合理性取决于理性共识的合理性。承诺－－采取一定可信方式，限制自己的选择承诺是将不可置信的威胁变成可置信的威胁的行动：威胁不仅是事前最优的，也是事后最优的。承诺意味着限制自己的自由：选择少反而对自己好。如“破釜沉舟”的故事举例：如果1承诺不选择U’121（2，0）（5，0）（4，2）（1，1）UDRLU’D’承诺举例婚姻中的承诺：彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺；订金