网站大量收购独家精品文档,联系QQ:2885784924

2014博弈论第一章1解读.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
的基本框架就形成了,故称为博弈的三个基本要素. 一个具体博弈界定,还须明确行动的顺序和有关的信息. 4、行动的顺序(the order of play):博弈中参与人实施决策活动的顺序. 同时或有先有后. 其他因素不变,但顺序不同,参与人的最优选择就不同,博弈的结果也不同. 事实上, 不同的顺序安排意味着不同的博弈. 静态博弈 和动态博弈. 5、信息(information):指一个博弈中参与人有关该博弈的知识,如关于其他参与人的策略集、支付函数、行动时间等. 博弈论中关于信 息的具体概念有: 信息集(information set)— 主要出现在动 态博弈中,可理解为参与人在特定时刻上对有关变量的值的知识;一个参与人无法准确知道的变量的全体属于一个信息集. 完美信息(perfect information)指一个参与人对其他参与人的行动选择有准确了解的情况即一个信息集只包含一个值. 是动态博弈的概念. 完全信息(complete information):指参与人的行动被所有的参与人准确观察到的情况,即没有事前的不确定性. 完全信息意味着各个参与人的支付函数是共同知识. 显然不完(incomplete) 信息意味着不完美(imperfect)信息. 共同知识(common knowledge)是与信息有关的一个重要概念.共同知识指 “所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…”. 在博弈论中,一般假定参与人的行动空间和行动顺序是共同知识. 6 博弈的解: 所有参与者都能接受的一个战略组合. 四、博弈的分类   分类是一种深化认识的方法. 博弈可以根据不同的标志从不同的角度进行多种分类. 通过分类我们将对博弈有进一步的了解,同时对博弈理论的结构体系有初步的认识. 1、按参与人的多少分:单人博弈和多人 博弈 2、按策略空间是否有限分:   有限策略博弈和无限策略博弈  3、按各策略组合下参与人支付之和情况分:   零和博弈、常和博弈和变和博弈 4、按参与人行动的顺序分: 静态博弈和动态博弈 5、按信息是否完全分:   完全信息博弈和不完全信息博弈  6、按信息是否完美分(动态博弈):   完美信息动态博弈和不完美信息动态博弈 博弈理论体系的结构框架按下面博弈类型安排: 静 态   动 态 完全信息 完全信息静态博弈   完全信息动态博弈   不完全信息  不完全信息静态博弈   不完全信息动态博弈   第一章 完全信息静态博弈 一个博弈由三部分构成 : 参与者 ,参与者 的战略 ,参与者的收益构成. 略(行动)构成的集合. 参与者的收益是参与者在博 参与者的战略选择空间是参与者的可选择战 弈中的得益. 参与者“共同知识 ”. “共同知识 ” :是指: 参与者都知道其他参与者的收益, 每一个参与者 完全信息是指: 都知道其他参与者知道他知道其他参与者的收益, 所有参与者的收益函数是每个 每一个 等等… . 静态博弈是指所有参与者同时选择行动或战 略. 同时:(彼此没有信息交流). 战略博弈: 是一种相互作用决策的模型, 这 一次行动,并且这些选择是同时进行的 . 该模型 包括参与人的有限集合,每个参与者的行动集合, 每个参与人的行动集合,以及建立在参与者行动 组合上的效用(收益)函数. 种模型假设每个决策主体选择且仅选择且仅选择 定义: 一个战略博弈包括(博弈分战略博 弈和扩展博弈) 1 有限集合 (参与者集合) 2 对每个参与者 有一非空集合 (对参与人有效的行动集合) 3 对每个参与人 一个建立在集合 上的偏好关系 (效用函数). 如果对每一个 是有限的,则博弈是有限的. 抽象地看,博弈是一个数学模型 --------“囚徒困境” 两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招人犯罪,警方并无充足证据将其按罪判刑. 警方把他们关入不同的牢室,并对他们说明不同行动带来的后果. 如果两个人都不坦白,将均被判为轻度犯罪,入狱一个月;如果两人都坦白招认,都将被判入狱6个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将判入狱9个月. 博弈论经典例子 1.1·A 博弈的标准式表述 经典例子;“囚徒困境”(prisoner,s dilemma) 在此博弈中,每个囚徒有两个可供选择的战 略: 坦白, 沉默. 在一组特定的战略被选定后,两人的收益由上表 中的数字给出,习惯上横行代表的参与者1的收益 囚徒1 -6

您可能关注的文档

文档评论(0)

三沙市的姑娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档