博弈论7不完全信息动态博弈解读.ppt

下载文档 降价啦

19
0
约6.96千字
约 70页
2017-01-22 发布于湖北
举报
版权申诉
保障服务

博弈论7不完全信息动态博弈解读.ppt

1、本文档共70页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论7不完全信息动态博弈解读

第七章不完全信息动态博弈至少部分博弈方没有关于得益全部信息的动态博弈，称“不完全信息动态博弈”或“动态贝叶斯博弈’。在不完全信息动态博弈中，按照海萨尼转换，博弈进行的先后顺序可以描述为：首先，“自然” 选择参与人的类型，参与人自己知道，其他参与人不知道；其次，参与人开始行动，参与人的行动有先有后，后行动者能观测到先行动者的行动，但不能观测到先行动者的类型。参与人的行动是类型依存的，每个参与人的行动都传递着有关自己类型的某种信息，后行动者可以通过观察先行动者所选择的行动来推断其类型或修正对其类型的先验信念(概率分布)，然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用，就会设法选择传递对自己最有利的信息，避免传递对自己不利的信息。因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正“信念”的过程。例题1：参与人i=1,2; 参与人1的行动空间A1=｛L,R｝参与人1的类型空间T1=｛t11,t12｝参与人2的行动空间A2=｛A,B｝参与人2的类型空间T2=｛t2｝,单点集，因此参与人1对参与人2的信念p1=1; 参与人2对参与人1的信念p2=(p,1-p); 参与人1先行动，参与人2后行动。按照海萨尼转换，该博弈表示为：例题2：考察一个市场进入博弈参与人i=1,2; 参与人1（在位者）的行动空间 A1=｛m1 (低价格),m2(高价格)｝参与人1的类型空间 T1=｛t11 (高成本),t12 (低成本)｝参与人2（进入者）的行动空间 A2= a1 (进入),a2(不进入)｝参与人2的类型空间T2=｛t2｝,单点集，因此参与人1对参与人2的信念p1=1; 参与人2对参与人1的信念p2=(p,1-p); 按照海萨尼转换，该博弈表示为：注释：参与人i对其他参与人的类型（私人信息）t-i的信念称为先验概率。当参与人 i在他的某个信息集h上观察到其他 n-1个参与人行动组合，条件概率 , 是参与者i在观察到的情况下，对参与者的类型t-i的修改，这个修正产生的推断称为后验概率在例1图7-1中，设R(t11),R(t12)是参与人1的两个战略。从而该博弈表示为完全但不完美的动态博弈图7-3 。但（L,A）又排除不掉，因为没有子博弈。假设在参与人2的信息集h2上,观察到R产生的后验概率为这时，参与者2选择A的期望收益为： 0*q+0*(1-q)=0 选择B的期望收益为： 1*q+1*(1-q)=10 所以参与人2一定会选择B. 参与人1知道理性的参与人2轮到他决策的信息集h2上会选择B，因此参与人的最优战略就是R(t12). 既然参与人1决定选择R(t12)，因此参与人2修正的信念推断是，所以就删掉了（ L，A ） 7.1 精炼贝叶斯纳什均衡 7.1.1后续博弈引入精炼贝叶斯均衡的目的是：为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡，这和子博弈精炼纳什均衡强化了纳什均衡是相同的。用更为广义的后续博弈的概念来代替子博弈，后续博弈可开始于任何信息集（而不论是否单结）。其后，进行相似的分析：如果参与者的战略要构成为博弈的一个精练贝叶斯均衡，它不仅必须是整个博弈的贝叶斯纳什均衡，而且必须构成每一个后续博弈的贝叶斯均衡。 [例子]：市场进入博弈（该博弈的扩展式表述模型见图7.2）如果我们将从每一个信息集开始的博弈的剩余部分称为一个“后续博弈”（注意与子博弈的不同：子博弈必须开始于单结信息集），一个“合理”的均衡应该满足：给定每一个参与人有关其它参与人类型的后验信息，参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求： (1)在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)； (2)给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的； (3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。 7.1.2 贝叶斯法则统计学上，修正之前的判断称为“先验概率”，修正之后的判断称为“后验概率”。贝叶斯法则是人们根据新的信息从“先验概率”得到“后验概率”的基本方法。一个不完全信息博弈中，假定参与人的类型是独立分布的，参与人i有K个可能类型，有H个可