博弈方法及其应用.pdfVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈方法及其应用博弈方法及其应用 典型的囚徒问题典型的囚徒问题 两个嫌犯受到指控两个嫌犯受到指控,,但除非至少但除非至少一个招认个招认,, 否则警方不能将二人判有罪。警察把二人 分别带到不同的房间分别带到不同的房间,,告之后果告之后果:: 如果二人均不坦白,将被判入狱一个月。 如果双方均坦白,将被判入狱6个月。 如果如果一方招认方招认,另另一方不招方不招,招认招认一方方 马上释放,另一方判入狱9个月(6+3 )。 囚徒甲囚徒甲 沉默 招认 囚徒乙囚徒乙 沉默 -1,-1 -9,0 招认 0,-9 -6,-6 博弈现象的三要素博弈现象的三要素  局中人-参与博弈但利益不完全一致者。 有二人博弈与多人博弈之分。  策略集策略集-每个局中人都会有每个局中人都会有一系列的策系列的策 略可选,称为对应于每个局中人的策略 集集。。有限和无限个对策有限和无限个对策。。  收益-在每策略组合下每一局中人的收 益情况益情况。是选择策略的标准是选择策略的标准。收益函数收益函数 或支付函数。 例例11:: 甲乙二人在桌上各放一枚硬币,如果同向。甲赢 一场;两面不同,乙赢一场。比赛两场告终。二 战全胜者可占有对方的硬币。 局中人局中人::甲甲、乙二人乙二人 策略集合:二人均为:正正、正反、反正、反反 四个策略四个策略。 ((有限有限)) 甲的收益函数见下表(乙的为甲的相反数): 乙的 收益 策略 正正 正反 反正 反反 甲的 策略策略 正正 1,-1 0,0 0,0 -1,1 正反 0,0 1,-1 -1,1 0,0 反正 0,0 -1,1 1,-1 0,0 反反 -1,1 0,0 0,0 1,-1 重复剔除严格劣势策略重复剔除严格劣势策略  严格劣势策略  如果某一局中人的两个策略S1与S2,有如下关系: 对于其他局中人的所有策略,均有S1的所有收益 >>S2S2的所有收益的所有收益,则称则称S2S2相对于相对于S1S1是严格劣势策是严格劣势策 略。  还需要假定还需要假定  所有局中人间相互了解  所有局中人是所有局中人是理性的性的  所有局中人都知道上述假定  有时没有严格劣势策略有时没有严格劣势策略 例例22 囚徒问题的求解囚徒问题的求解 囚徒乙 沉默沉默 招认招认 囚徒甲 沉默 -1,-1 -9,0 招认 0,-9 -6,-6 例1的求解--无严格劣势策略 乙的 收益 策略 正正 正反 反正 反反 甲的 策略策略 正正 1,-1 0,0 0,0 -1,1 正反 0,0 1,-1 -1,1

文档评论(0)

max + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档