网站大量收购独家精品文档,联系QQ:2885784924

扩展型博弈和策略型博弈.pptVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
扩展型博弈和策略型博弈.ppt

扩展型博弈和策略型博弈 扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。 扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。 图I.4: 博弈树 (讲义) 基本定义 一个扩展型博弈包含一个局中人集I,一个节点集T,一个有向线段集E,和一个赢得向量集V。 每个有向线段的两个端点都是节点,依方向顺序一个叫始点,一个叫终点。 如果从节点t始,经过一个接一个的有向线段可以连接到节点t’,就称t’为t的后继点 (或t是t’的先行点)。 每个节点或是一个或多个有向线段的始点,并且/或者是一个有向线段的终点。 不作为任何有向线段终点的节点叫做博弈始点,不作为任何有向线段始点的节点叫做博弈终点。 基本定义 将博弈始点通过一个接一个的有向线段连接到某个博弈终点,就得到一条博弈路径。每个博弈终点附上一个赢得向量,第i个分量表示局中人i的赢得。 节点集T可以划分为两两不相交的若干个子集:其中每个局中人有一个,叫做他的决策节点集;自然界有一个(如果信息不完全),叫做机会节点集;还有一个子集包含所有的博弈 终点。 每个局中人的决策节点集可以进一步划分为若干个两两不相交的信息集,每个信息集的节点用气球括起来或者用虚线连在一起,表示该局中人决策时不知道自己在那个节点上。 基本定义 从某局中人一个信息集的节点引出的每个有向线段表示他的“一着”,选定一着表示他在同一个信息集的所有节点选定同一个行动。 一个局中人在每一个信息集都选定一着,就选定他的一个纯策略;即一个纯策略是一个完整的行动计划。局中人i的纯策略集用Si表示。 每个局中人都选定一个纯策略,就构成一个策略横断面s (strategy profile);这时可以算出博弈的一个赢得向量或者一个期望赢得向量。全体纯策略横断面的集合记为S。 基本定义 不管博弈的动态过程,仅着眼于局中人,各人的纯策略和赢得,就得到博弈的策略型[I,S,V]。 一个策略横断面s*=(s*1,…,s*n)叫做Nash均衡,如果对每个局中人i, 他选定的策略s*i都是对所有其它局中人选定的策略s*-i的最优回应:pi(s*)?pi(s*|si), ?si?Si, ?i?I。 一个博弈不一定有纯策略Nash均衡;如果有,则不一定唯一。 二人策略型博弈Nash均衡的计算 可以按照定义找出所有的纯策略Nash均衡; 如果策略型博弈比较复杂,可以用策略间的“优”, “劣”关系化简,然后再寻找均衡。称i的一个策略si劣于si (或si优于si),如果不管其他人选定什么策略,si都比si使i得到更小的赢得。如果存在一个si,它优于i的任何其他策略,就称si为i的最优策略。显然,劣策略不可能构成Nash均衡。所以,寻找Nash均衡时可以把劣策略划掉以简化策略型博弈。 混合策略Nash均衡 当一个博弈没有纯策略Nash均衡时,人们考虑计算所谓混合策略Nash均衡。 局中人的一个混合策略是指他按照某个概率分布随机地选用各个纯策略;如果他有K个纯策略,那么他的一个混合策略可以表示为?i=(pi1,…,piK),其中pik是他选用第k个纯策略的概率。 当局中人使用混合策略时,各人的期望赢得等于他在每一个纯策略横断面上的赢得与该策略横断面出现的概率的乘积之总和。为简便计,i的期望赢得函数仍然用?i表示。 混合策略Nash均衡 局中人i的全体混合策略的集合记为??i;注意一个纯策略也可以看作一个特殊的混合策略。 如果每个局中人都选用一个混合策略,就得到一个混合策略横断面。全体混合策略横断面的集合记为?。 一个混合策略横断面?*=(?*1,…, ?*n)叫做混合策略Nash均衡,如果如果对每个局中人i, 他选定的混合策略?*i都是对所有其它局中人选定的混合策略?*-i的最优回应:pi(?*)?pi(?*|?i), ??*i??i, ?i?I。 混合策略Nash均衡 Nash定理:任何有限的策略型博弈(局中人数目有限,每人的纯策略数目有限)

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档