- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 动态博弈与逆向归纳法 逆向归纳法 应用的例子 理性的局限与非理性的行为 逆向归纳法 美中军事政治博弈 在我国解放初期,美国一直试图对我国实施打击。此时,我国必须对美国采取应对之策。就我国对美国可以采取的行动而言,无非是回击或不回击。用更符合毛泽东的话来说,美国可以“犯我”或“不犯我”,而我们可以“犯人”或“不犯人”。 由此我们可以刻画出一个动态博弈: 参与人:美国、中国; 行动空间:美国可选择的行动是“犯我”或“不犯我”;中国的选择是“犯人”或“不犯人” 行动顺序:美国先行动;中国观察到美国的行动启再选择自己的行动; 赢利: 我们这样假设赢利状况( 数字是虚拟的); 如果美国“犯我”,中国“犯人”,恶战再所难免,则美国亏损 2,中国亏损 2; 如果美国“犯我”,中国“不犯人”,那么中国沦为美国的附庸,丧失国家主权,则美国获得 2,中国亏损 4; 如果美国“不犯我”,中国“犯人”,那么就是中国挑起战事,美国正好有借口纠合国际力量打击中国,则美国得 3,中国亏损 5; 如果美国“不犯我”,中国“不犯人”,各自和平地发展经济,则美国得 1,中国得 1。 博弈树 对博弈树的解释 美国先选择“犯我”或“不犯我”,然后中国观察美国的选择后选择“犯人”或“不犯人”,最下边的括号内数字是各种情况下双方的赢利状况,前一个数字代表第一个行动人( 美国)的赢利,第二个数字代表第二个行动人( 中国) 的赢利。依此类推,如果有更多的参与人序贯行动,则赢利的排列顺序与行动顺序一致。 博弈的均衡 在完美信息动态博弈中,要找的均衡实际上是一条路径,即从第一个行动人决策结点出发,一直到某一个终点之间的路径。 所谓均衡路径就是在每一个决策阶段,没有人会偏离这条路径。这条路径所代表的策略均衡被称做子博弈完美均衡。 如何用逆向归纳法来求解博弈的均衡? 首先,最后阶段行动的参与人决策开始考虑。在图4-1 的博弈中,最后行动的是中国,因此先考虑中国怎么决策。在考虑中国的决策时,我们假定美国已经选了“犯我”或“不犯我”, 如果美国选择了“犯我”,在图4-1 中可发现,中国选择“犯人”会得到-2,选择“不犯人”会得到 -4,因此中国必然选择“犯人”。在中国“犯人”的分枝上画上一个短短的双横线标记; 考虑次后阶段行动的人( 例子中只有两个阶段,因此实际上就是第一阶段行动的人)—美国。美国决策时会考虑中国的反应,而现在它已预见到中国将选择的行动就是两条划了双横线的分枝。所以,它很容易推出自己面临的情况是: 若选择“犯我”,则必然导致中国“犯人”,则美国得到- 2; 若选择“不犯我”,则中国必选择“不犯人”,则美国得到 1; 结果美国宁愿选择“不犯我”。照规矩,我们在美国“不犯我”的一个分枝上画上双横线。 如果存在一个路径,其每个分枝都画上了双横线,那么这条路径就是均衡路径。 在图 4-1 的例子中,均衡路径将是美国选择 “不犯我”,而中国选择“不犯人”。 子博弈完美均衡的定义:一个策略组合只有在其路径既满足是整个博弈的均衡又满足该路径上每一个子博弈的均衡的时候,才是子博弈完美均衡。 练习 运用逆向归纳法:最后阶段是甲选择“前”或“后”,由于选“前”甲得到 0,选“后”甲得到 3,因此甲选“后”; 给定第三阶段甲选“后”,那么第二阶段乙选“左”得到 1,选“右”将只能得到 0,因此乙选“左”;再看第一阶段,如果甲选择“下”得到 2,选择“上”(则乙选“左”结束博弈)得到 1,因此甲将直接选“下”结束博弈。 私奔博弈 在我国汉代,有个青年作家叫司马相如,有个年轻的寡妇叫卓文君。卓文君的父亲喜欢附庸风雅,经常请一些所谓的才子到家里吟诗作赋,其中就包括司马相如。日子长了,司马相如与卓文君产生了爱情并打算结婚。但是,这门亲事遭到文君父亲的反对。父亲对文君说,你若跟司马结婚,那么就将脱离父女关系。 卓文君应该怎样选择?是屈从父亲还是跟心上人结婚? 博弈得益描述 文君先选择与司马断绝关系或者结婚,若与司马断绝关系,则她失去一个心爱的人,得到 - 1 的赢利( 她父亲则得到赢利 1,因为他终于如愿以偿让女儿没能跟司马结婚);若选择结婚,则由文君的父亲做出反应,他可以真的断绝父女关系,此种情况下,文君得到 0 (困为她虽然跟爱人结婚得到 1,但是却因此失去了父亲得到 - 1,总计得到 0),父亲得到 -1-1 =-2 (因为看到文君与司马结婚心中不快得到 -1,又失去女儿所得再增加-1);当然,既然生米煮成了熟饭,父亲也可以默认,此时文君既得到爱人又没有失去父亲故获得赢利 1,而父亲心中不快得到 - 1,但毕竟没有失去女儿。 使用逆向归纳法不难得到,第二阶段父亲将选择默认(因为默认的赢利为 - 1,而断绝父女关系的赢利为 - 2);给定第二阶段父亲会默认,第一阶段文君将选择结婚( 结婚
您可能关注的文档
- epc专用条款部分.doc
- 中考语文记叙文阅读常见20类题型.doc
- 商务英语 选择题.doc
- 仁爱版九下知识点(good).doc
- 勤奋读书,刻苦学习.ppt
- 2017尔雅幸福与心理学网课各单元答案.doc
- -《mysql数据库基础》教学大纲.pdf
- 《彼得林奇的成功投资》读书笔记和思维导图.ppt
- 《八十天环游地球》讲学课件.ppt
- 《测绘地理信息质量管理办法》(2015版).pdf
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
最近下载
- 公共危机案例.pdf VIP
- 3.5跨学科实践:探索厨房中的物态变化问题 +章节梳理延伸 课件 人教版(2024)物理八年级上册.pptx VIP
- 初中物理作业设计优秀案例(3篇).pdf
- 2023年急性ST段抬高型心肌梗死诊断和治疗指南.docx
- 大气的受热过程说课稿2023-2024学年高中地理湘教版(2019)必修一.docx VIP
- 外研版2023必修第一册Unit 3 Family matters重点词汇短语练习含答案.pdf
- 国家开放大学《心理学》形考任务1-4参考答案.docx VIP
- 售后转正工作总结PPT.pptx
- ISO45001品质中心第三方审核记录.doc
- 3.5+跨学科实践:探究厨房中的物态变化问题++课件-2024-2025学年物理人教版八年级上册.pptx VIP
文档评论(0)