- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论第2讲2013.ppt
* 重复剔除严劣策略均衡 当然应该剔除严劣策略“左” 参 与 人 1 参 与 人 2 上 下 左 中 1, 0 1, 3 图 1-6 * 重复剔除严劣策略均衡 当然应该剔除严劣策略“左”,见图1-7 此时余下唯一策略组合(上,中),从而得到重复剔除严劣策略均衡 参 与 人 1 参 与 人 2 上 中 1, 3 图 1-7 汉尼拔进攻罗马,弱劣策略不能剔除。 * * 局中人2 L C R U 局中人1 M D 4,3 5,1 6,2 2,1 8,4 3,6 3,0 9,6 2,8 练习1重复剔除严劣策略求解博弈的均衡 * 课程主要内容 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈 * 完全信息静态博弈概念 概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例 石头、剪子、布游戏 彼此了解的两个厂商的价格战 * 完全信息静态博弈概念 有些实际博弈 虽然决策不是在绝对时间意义上的“同时”, 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 如不同竞标单位作出的工程投标决策 * 博弈的策略式表述 常用G表示一个博弈 博弈模型的两种表示形式 策略式表述 (Strategic form), 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述 * 博弈的策略式表述 参与人集合 N人博弈的参与人集合,往往也记为N。参与人则记为i, i∈ N 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si ∈ Si. * 对于给定的参与人i, i=1,2,…N, 卡氏积 S1×S2 … ×Si-1 × Si+1 …× Sn 表示除了参与人i外所有参与人所有策略的可能组合,通 常记为S-i; 于是所有参与人不同策略组合构成的策略空间可表示为 S=(Si , S-i) 博弈的策略式表述 * Si中的元素 si 表示参与人i的一个具体策略 一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, … sN),s∈S。 博弈的策略式表述 * 参与人i的效用函数 参与人 i的支付函数,是从博弈局势集 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn)的偏好。 一个博弈可以表示为 G = {S1, … ,SN; u1, … ,uN, i ∈N} 这就是博弈的策略式表述 博弈的策略式表述 * 博弈的策略式表述 例 写出囚徒问题的策略式表述 参与人集合N={囚徒1,囚徒2} 参与人的策略集S1=S2= {坦白,不坦白} 各参与人的支付,可用图1-1表示。 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵 囚徒1 囚徒2 * 博弈的策略式表述 实质上,图1-1已经完全表述了囚徒困境的策略式表述信息 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵 囚徒1 囚徒2 * 占优均衡 英文术语:Dominant-strategy Equilibrium 定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 * 占优策略 对于所有的s-i, si*称为参与人i的严格占优战略,如果满足: ui(si*,s-i)ui(si,s-i) ? s-i, ? si ?si* * 占优均衡 占优均衡定义 一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 * 占优均衡 占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。 坦 白 不坦白 坦 白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚
文档评论(0)