- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论概要完全版I
交通大学博弈论课程概要 (I)
周林
二零零四年十二月
主要教材:博弈论(Fudenberg Tirole)
引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱.
第一部分:完全信息策略式博弈 — 静态博弈
策略式博弈的基本三要素:博弈者,策略空间,收益函数(FT 1.1)
策略式博弈的基本三解法:
占优策略. 例子: 囚徒困境,二价拍卖(Ebay, 易趣网)(FT 1.1)
重复剔除劣策略. 例子:双寡头Cournot竞争(线性需求)(FT 1.1, FT 2.1)
Nash 均衡 (最重要的概念) (FT 1.2)
三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加.
Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡. (FT 1.3)
证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映
射(Berge定理), 最佳反应映射的不动点就是Nash 均衡.
利用(Kakutani不动点定理)Brouwer不动点定理找出不动
点.(注意:这里的最佳反应映射不是一个压缩映射, 因
此不能用迭代法逼近不动点.)
推论:任何有限策略博弈至少有一个混合策略Nash 均衡.
Nash 均衡一般非唯一,非Pareto最优. 可以通过外在信号机制改善收益.
相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效.
(FT 2.2)
作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (FT). 以及下面的题目:
证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合理的定义)一定存在一个对称的Nash 均衡.
画出下列博弈中所有的相关均衡生成的收益向量:
博弈者 2
博弈者 1 T W T -1, -1 2, 1 W 1, 2 5/3, 5/3
第二部分:完全信息扩展式博弈 — 动态博弈
例子:斯塔克伯格模型 (FT 3.1)
多阶段可观察行为博弈 (FT 3.3.2)
0阶段: 每一个博弈者可以独立选择一个行动 .
1阶段: 在本阶段前的历史 决定了本阶段每一个博 弈者可以选择的行动的范围. 每一个博弈者再独立选择 一个行动.
…………
k阶段: 在本阶段前的历史 决定了本阶段每一个博弈者可以选择的行动的范围. 每一个博弈者再独立选择一个行动.
…………
博弈在K阶段后中止.(我们允许K为无穷,此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史 : .
(不一定每一个博弈者在任何一个阶段k和历史时都要做选择. 此时我们只要让即可.)
多阶段可观察行为博弈的策略式博弈表示(FT 3.3.2)
策略空间: 每一个博弈者的策略是一个完整的计划,包括了在所有 的阶段k和所 有可能发生的历史时会采取怎样的相应行动(想象一 本理想化的棋谱).
收益函数: 对于任何一个所有博弈者的策略的组合,我们可以逐阶段 的找出相应博弈者行动的历史,从而决定每一个博弈者获得的收益.
多阶段可观察行为博弈的求解(FT 3.5)
对任何一个多阶段可观察行为博弈,我们首先可以找出它的策略式博 弈的Nash 均衡. 但是其中可能含有不合理的解,我们需要对Nash 均 衡进行挑选(精炼).
逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈.
子博弈完美: 可以用于所有的多阶段可观察行为博弈.
一个多阶段可观察行为博弈G在任何一个历史后的延续本身 也是一个博弈. 我们称其为原博弈G的一个子博弈, 记为. 如果G的一个Nash 均衡在它所有的子博弈上的限制也是子博弈 的一个Nash 均衡,我们称之为一个子博弈完美的Nash 均衡.
子博弈完美Nash 均衡的判断条件:单阶段偏离原则* (FT 3.3.2)
子博弈完美Nash 均衡的应用:囚徒困境的重复博弈, 有限和无限情况(FT 4.3)
子博弈完美Nash 均衡的应用:Rubinstein议价模型(FT 4.4)
作业:3.3,3.5, 3.7, 3.8, 4.5(a)(b),
您可能关注的文档
最近下载
- 附件2.安徽省老年大学(学校)建设指导标准(试行).doc
- 《职业素养》知识考试题库(含答案).docx
- DBJ33_T 1321-2024《建筑施工拉杆式悬挑脚手架安全技术规程》.pdf
- 2025年公务员考试时事政治100题及答案(含知识点).docx
- 2024年江西电力职业技术学院单招职业技能测试题库及答案(各地真题).docx VIP
- 新项目方法验证能力确认报告2023简化模板:空气质量 甲醛的测定 乙酰丙酮分光光度法GBT 15516-1995.pdf VIP
- 美的面包机食谱-官方通用版.pdf
- 抗凝剂皮下注射护理规范.pptx VIP
- 学校物业管理服务方案(精选8篇).docx VIP
- 自动控制原理(全套课件1085P).ppt
文档评论(0)