第6.4讲：RepeatedGames(IV)：以“三价博弈”为例.ppt

下载文档 降价啦

14
0
约 31页
2017-06-05 发布于湖北
举报
版权申诉
保障服务

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例.ppt

1、本文档共31页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例概要

三价博弈的两次重复博弈（续）总结： * 子博弈完美纳什均衡路径两次重复博弈实现的总得益组合 1：{（M，M），（M，M）} （3+3δ，3+3δ） 2：{（L，L），（M，M）} （1+3δ，1+3δ） 3：{（M，M），（L，L）} （3+δ，3+δ） 4：{（L，L），（L，L）} （1+δ，1+δ） 5：触发策略实现的博弈路径（5+3δ，5+3δ）三价博弈的两次重复博弈（续）触发策略：博弈方1：第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。博弈方2：同博弈方1。 * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 三价博弈的两次重复博弈（续）触发策略实现的可能博弈路径 {(H,H) , (M,M)} {非(H,H)策略组合， (L,L)} * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。三价博弈的两次重复博弈（续）当δ1/2时,触发策略实现的博弈路径必为{(H,H)， (M,M)}, 是一个子博弈完美纳什均衡。首先，考察最后一个阶段（即第二次重复）的博弈结果。触发策略实现的可能博弈路径为｛(H,H)， (M,M)｝或｛非(H,H)策略组合， (L,L)｝。也就是说，在触发策略组合下，第二次重复的博弈结果不外乎是（M,M）或（L,L）。这两种博弈结果都是纳什均衡！ * 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 三价博弈的两次重复博弈（续）其次，考察倒数第二阶段（即第一次重复）的博弈结果。基于对第二次重复的博弈结果分析，得到两博弈方在第一次重复博弈时的得益矩阵。利用划线法不难发现（M，M）和（L，L）均为纳什均衡。 * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）为使得（H，H）为纳什均衡，那么需要： * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）很显然，当δ1/2时，5+3δ6+δ3+δ1+δ 。所以，当δ1/2时，纳什均衡（H，H）实现的是两博弈方的最佳得益，因此两博弈方必然会采用它！ * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）总结： * 子博弈完美纳什均衡路径两次重复博弈实现的总得益组合 1：{（M，M），（M，M）} （3+3δ，3+3δ） 2：{（L，L），（M，M）} （1+3δ，1+3δ） 3：{（M，M），（L，L）} （3+δ，3+δ） 4：{（L，L），（L，L）} （1+δ，1+δ） 5：触发策略实现的{(H,H)， (M,M)}, （5+3δ，5+3δ）三价博弈的两次重复博弈（续）？当δ1/2时，策略组合5（触发策略）为什么能够实现较有效的总得益组合呢原因在于它具有“报复机制”。 * 三价博弈的两次重复博弈（续）在触发策略下，在第一个重复阶段，给定博弈方2选择H，如果博弈方1不选择H，而选择M，得益增加1单位；但这个偏离后果是他在第二阶段的得益将由3单位下降为1单位。这样，如果1（3-1）δ（即δ1/2），博弈方1偏离（H，H）是得不偿失的，他将没有积极性偏离。同理，当δ1/2时，博弈方2也将没有积极性偏离（H，H）。 * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。三价博弈的两次重复博弈（续）触发策略触发策略实际上是一种典型的策略。在这类典型策略中，两博