- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精练贝叶斯纳什均衡的定义 精练贝叶斯纳什均衡的要点 精练贝叶斯均衡是均衡战略和均衡信念的结合:给定信念 ,战略 是最优的; 给定战略 ,信念 是使用贝叶斯法则从均衡战略和所观测到的行动得到的。 求解精炼贝叶斯均衡的过程中,有一点需要注意的是:在完全信息博弈中,我们习惯用逆向归纳法(backward induction)求解精炼均衡;但是,在不完全信息博弈的情况下,后验概率与战略是相互依存的关系,两者互相依赖,这样,如果我们不清楚先行动者的行动选择,我们就不可能知道后行动者应该如何选择。因此,逆向归纳发在不完全信息博弈求解中是不适用的,取而代之,我们必须使用前向法(forward manner)进行贝叶斯修正。 信号传递博弈及其应用举例 假设: (1)参与人1的类型为ti∈T={t1,t2,…,tK} 参与人1知道ti,但参与人2不知道,只知道1的类型的先验概率p(ti), Σp(ti)=1。 (2)参与人1在知道自己的类型后选择发出信号m∈M={m1,m2,…,mJ}。 (3)参与人2观测到参与人1发出的信号(但不是类型) 使用Bayes法则从先验概率p=p(ti)得到后验概率p=p(ti|m),然后选择行动a∈A={a1,a2,…,aH}; (4)双方的得益函数为u1(m,a,t)和u2(m,a,t )。 下图是一个简单的信号传递博弈的展开式表述,这里K=J=H=2,p=p(t1|m1),q=p(ti|m2)(省略了得益): 信号发出者是领头者(leader),信号接收者是尾随者(Follower)。 当参与人1发出信号时,他预测到参与人2将根据他发出的信号修正对自己类型的判断,因而他的问题是如何选择一个最优的类型依存信号战略m*(tj)? 同样,参与人2知道参与人1选择的是给定类型和考虑信息效应情况下的最优战略,因此他的问题是使用Bayes法则修正对参与人1类型的判断,选择自己的最优行动a*(m)。 ——此处参与人的最优是指根据修正概率计算的期望支付最优。 其中:m(t)是参与人1的类型依存信号策略,a(m)是参与人2的行为策略(允许混合策略)。 信号传递博弈的精练Bayes均衡定义 定义: 信号传递博弈的精练Bayes均衡是战略组合(m*(t),a*(m))和后验概率p(ti|m)的结合,它满足: 精练贝叶斯均衡 信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类: 分离均衡:不同类型的发送者(参与人1)以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号;在分离均衡下,信号准确地揭示出类型。 混同均衡:不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。 准分离均衡:一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。 在K=J=2时的信号传递博弈模型 这里p=p(t1|m1),q=p(ti|m2)(省略了得益): 在K=J=2时信号传递博弈的四种纯战略 信号发送者(参与人1)的四种纯战略: 混同于m1:如果自然赋予类型t1,选择信号m1;如果赋予类型t2,选择信号m1。 混同于m2:如果自然赋予类型t1,选择信号m2;如果赋予类型t2,选择信号m2。 分离,ti选择mi:如果自然赋予类型t1,选择信号m1;如果赋予类型t2,选择信号m2。 分离,ti选择mj,i≠j:如果自然赋予类型t1,选择信号m2;如果赋予类型t2,选择信号m1。 在K=J=2时信号传递博弈的四种纯战略 信号接受者(参与人2)的四种纯战略: 战略1(总是选择a1):如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a1 。 战略2 (跟随mi选择ai) :如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a2。 战略3 (与mi相反选择aj,i≠j) :如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a1。 战略4 (总是选择a2) :如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a2。 不同类型的发送者(参与人1)选择相同的信号,或没有任何类型选择与其他类型不同的信号,因此接收者(参与人2)不修正先验概率(参与人的选择没有信息量)。设mj是均衡策略,那么: u1(mj,a*(m),t1)≥u1(m,a*(m),t1), m∈M u1(mj,a*(m),t2)≥u1(m,a*(m),t2), m∈M p(tk|mj)≡p(tk) 在K=J=2时的混同均衡 后验概率 p(t1|m1)=p(t1), p(t1|m2)=p(t
您可能关注的文档
- 江阴高新区服务业项目投资指南教案.ppt
- 时间管理就业指导教案.ppt
- 江阴高中谈政教处工作教案.ppt
- 时间管理——就业指导教案.ppt
- 将高效进行到底《新课程有效课堂教学行动策略》二级培训教案.ppt
- 时间管理课程—明阳天下拓展.教案.ppt
- 时间管理——卢亚静教案.ppt
- 姜大源基于工作过程的课程开发教案.ppt
- 时间管理——明阳天下拓展培训教案.ppt
- 时间管理能力测试教案.ppt
- 2025年广西职业院校技能大赛高职组(建筑工程识图赛项)参考试题库及答案.pdf
- 2025年江西省高考物理模拟试卷试题及答案详解.docx
- 2024年全球及中国潜水浊度传感器行业头部企业市场占有率及排名调研报告.docx
- 2024年全球及中国重组尿酸酶行业头部企业市场占有率及排名调研报告.docx
- 2024-2030全球安神补脑片行业调研及趋势分析报告.docx
- 2024版事业单位编制内员工聘用合同版B版.docx
- 2024-2030全球云文档捕获软件行业调研及趋势分析报告.docx
- 2024年全球及中国线性电机轴行业头部企业市场占有率及排名调研报告.docx
- 2024版事业单位终止合同协议书.docx
- 2024版事业单位管理岗位聘用合同版B版.docx
文档评论(0)