Game02博弈标准式与重复剔除.pptVIP

下载本文档

8
0
约6.57千字
约 44页
2017-05-31 发布于上海
举报
版权申诉

Game02博弈标准式与重复剔除.ppt

1、本文档共44页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Game02博弈标准式与重复剔除ppt课件

性质1—知识公理(the axiom of knowledge)：可确保真实状态ω总是某个参与人信息集中的一个元素；即真实发生的事件总包含在某参与人的信息分割中；性质2—标准一致性（a consistency of criterion)：如如果有且，但是表示： ω `与ω、 ω ``与ω`分别在同一信息分割中，但ω ``与ω又不在同一信息分割中。（选择标准矛盾） * 知识函数和共同知识定义定义知识函数K(E) ：对于状态空间上的任何事件E（ ?的一个子集），有： K(E)就是决策者i知道的有关该事件E的所有状态的集合。共同知识的定义： K1和K2是两个博弈人的知识函数，事件E是状态发生时两个人的共同知识，如果满足以下一个无穷序列： K1(E), K2(E), K1（K2(E)）, K2（K1(E)）··· 表示：1(2)知道事件E, 1(2)知道2（1）知道事件E ··· * 课堂实验：两个人带帽子的游戏：每个人能看到对方戴什么颜色的帽子，但不知道自己戴什么帽子；问“至少有一种颜色（如红色）的帽子”是不是这两个人的共同知识？ * 答案：不是，只是相互知识；因为博弈人1知道2戴红色帽子，但不知道2知道自己（指1）戴红色帽； 2同理亦然。 * 5.3 重复剔除严格劣策略法 * 严格劣策略（strictly dominated）的定义：定义：策略是博弈人i的严格劣策略，如果对于其他策略满足：弱劣策略：若满足下列不等式，则策略是博弈人i的弱劣策略：如囚徒困境，合作（即抵赖）是严格劣策略。 * 重复占优（Iterated Dominance） Proposition：如果参与人 i 是理性的，则他不会选择严格劣策略。因为对应于该参与人的任何信念，均满足：优势策略（占优策略）：严格优策略，如囚徒困境中的“坦白”。 * 求解博弈结果——重复剔除严格劣策略法举例：如果博弈人2是理性的，则不会选择策略M；如果博弈人1意识到自己知道对方是理性的，且自己是理性的，则不会选D 博弈人2也意识到对方知道自己是理性的。如果2知道1是理性的，则2知道1不会选D;因此2不会选R 两个理性博弈人的最终选择结果是（U, L)（严格劣策略均衡）博弈人1 博弈人2 * 重复剔除严格劣策略的步骤： 2 1 L M R U 2，2 1，1 4，0 D 1，2 4，1 3，5 2 1 L M R U 2，2 1，1 4，0 D 1，2 4，1 3，5 2 1 L M R U 2，2 1，1 4，0 D 1，2 4，1 3，5 2 1 L M R U 2，2 1，1 4，0 D 1，2 4，1 3，5 * 对博弈人知识水平的讨论：博弈人2是理性的，不会选M；博弈人1知道2是理性的（即不选M） 1自己是理性的不会选D； 2知道1知道自己是理性（不选M） 2知道1是理性的（不选D） 2自己是理性的不会选R；得到博弈结果（U,L)。到此博弈人2知道该结果。那么博弈人1知道不知道该结果呢？这需要1有更进一步的知识（即更高阶的知识水平）。 * 总结：消去劣策略这种求解博弈过程的重复次数越多，对参与人知识层次（即反映信息深度）的要求就越高；当理性为共同知识（即I know that my opponent is rational, that he knows that I am rational, that I know that he knows that I know that he am rational etc）时，消去劣策略就可以重复无限次地进行；因此，理性和理性是共同知识的假设是重复消去劣策略法的两个前提假设。如果放松共同知识的要求会如何？ * 上例中博弈结果（U,L)，隐含前提：博弈人理性是共同知识现放松该假设，有：博弈双方均是理性的；博弈人1认为博弈人2是傻的、以等概率随机性地选择其策略博弈人2知道1是理性的，也知道1知道自己的选择是随机的博弈结果： (D, R) （why?合理吗？) * 上述分析：存在某种不一致性：如由诸如博弈人1和2的很多对博弈人不断对该博弈进行重复，即重复博弈；每一次重复（即阶段博弈）有相同的博弈结果（D, R）；重复几次后，博弈人1就会意识到：博弈人2在一致性地选R；这时1就会更新对博弈原有的知识，认为2并不像当初自己假设的那么傻；一旦1意识到博弈人2一直选择R，则博弈人1通过选择U会改进其效用。（D, R)的结果就不成立了共同知识的假设可消除上述的不一致性问题。 * * 完全信息静态博弈Lec02 博弈的标准式及重复剔除法内容概览 1.博弈的标准