进化博弈基本动态理论[精选].doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
进化博弈基本动态理论[精选]

进化博弈基本动态理论 广东省顺德职业技术学院经济管理系 张良桥 摘 要:本文主要介绍进化博弈理论的基本动态模型:对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。为了便于理解,在文中引用了一些简单的例子说明它们之间的区别与联系。在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。最后本文比较了经典博弈理论与进化博弈理论在动态概念上的差别。 关键词:进化稳定策略 模仿者动态 随机稳定均衡 进化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;B?rgers and Sarin(1995,1997)等提出的强化动态(Reinforcement Dynamics)模型等等。但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonker(1978)提出的模仿者动态(Replicator Dynamics)模型。模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。 一、确定性模仿者动态 一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。按所研究的群体数目不同,进化博弈动态模型可分为两大类:单群体(Monomorphic Population)动态模型与多群体(Polymorphic Populations)动态模型。单群体动态模型是指所考察的对象只含有一个群体,并且群体中个体都有相同的纯策略集,个体与虚拟的参与人进行对称博弈。多群体动态模型是指所考察的对象中含有多个群体,不同群体个体可能有不同的纯策略集,不同群体个体之间进行的是非对称博弈。博弈中个体选择纯策略所得的支付不仅随其所在群体的状态变化而变化,而且也随其他群体状态的变化而变化。下面重点介绍单群体与多群体动态模仿者动态模型。 1. 单群体确定性模仿者动态模型 单群体模仿者动态模型是由Taylor and Jonker (1978)在考察生态演化现象时首次提出的。他们把一个生态环境中所有的种群看作为一个大群体,而把群体中每个种群都想象或程式化为一个特定的纯策略。群体在不同时刻所处的状态一般用混合策略来表示。所谓模仿者动态是指使用某一纯策略的人数所占比例的增长率等于使用该策略时所得支付与群体平均支付之差,或者与平均支付成正比例。为了说明的方便,本文首先给出一些符号,然后给出Taylor and Jonker (1978)模仿者动态公式的推导过程。 假定群体中每一个个体在任何时候只选择一个纯策略,比如,第j个个体在某时刻选择纯策略(当然由于突变或策略转移,同一个体在不同时刻可以选择不同的纯策略)。 表示群体中各个体可供选择的纯策略集;N表示群体中个体总数;ni(t)表示在时刻t选择纯策略i的个体数。 表示群体在时刻t所处的状态,其中表示在该时刻选择纯策略的人数在群体中所占的比例,即。 表示群体中个体进行随机配对匿名博弈时,群体中选择纯策略的个体所得的期望支付。 表示群体平均期望支付。 下面给出连续时间模仿者动态公式,此时动态系统的演化过程可以用微分方程来表示。在对称博弈中每一个个体都认为其对手来自于状态为x 的群体。事实上,每个个体所面的对手是代表群体状态的虚拟个体。假定选择纯策略的个体数的增长率等于,那么可以得到如下的等式: 由定义可知,两边对t微分可以: 两边同时除以N得到 上式就是对称博弈模型中模仿者动态公式的微分形式。可以看出,如果一个选择纯策略的个体得到的支付少于群体平均支付,那么

文档评论(0)

jsntrgzxy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档