- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
演化博弈8.1有限理性在新古典经济学和大多数的博弈论中都假定,人是追求收益最大化的,并且可以无误地选择最优反应战略。但很多人认识到人的真实理性是有限的。赫伯特·西蒙研究认为,如果人们在某一问题有满意解时,就不会再去寻找最优解。在经典博弈论中,假设参与人具有使自己支付最大化的主观意识与对于对手策略的最优反应能力,在实际中,这种假设可能是不现实的。譬如在“象棋”中,棋手不可能在每一步都能够采取最优的反应行动。因而有必要把参与人的完全理性行为假设推广为不完全理性行为的假设。关于信任博弈Berg等人于1995年首先对信任博弈进行了研究,假设两个参与者P(提议者,Propose)和R(响应者,Responder),P首先从实验组织者那里得到数量为m的钱,然后自行决定把数额为x的钱交给R(0≤x≤m)。实验者再把3x的钱奖励给R。最后,R可以自由返回给P数额为y的钱。根据逆向归纳法,实验的结果应该是:不管P给了R的x是多少,R的最优策略是y=0,因此P的最优策略应该是x=0。但实验的实际结果完全不是这样,大部分的提议者总会把一定数量的钱交给R,而大部分的R也会把一部分奖励分给P,而且,x和y之间有很强的正相关。8.2引例:鹰鸽博弈1、鹰鸽博弈鹰鸽策略模型是博弈中的一个经典模型。为了争夺资源(比如土地、食物、政权、配偶等),群体中的成员之间要进行斗争,设每个成员为博弈中的局中人,局中人可以采取两种策略,一种是恶意的强硬进攻策略“攻击对方”(不顾一切争斗下去,直到一方失败退出竞争为止),称之为“鹰策略”,用“H”表示;另一种是善意的平和宽容策略“和平相处”(允许对方分享利益,不主动争斗,在对方进攻时只是虚张声势地吓唬一番,一旦争斗起来,为避免两败俱伤,采取退让策略,但也可能给予一定的报复),称为“鸽策略”,用“D”表示。2、假设有一群鸟,一部分(25%)采用H,另一部分(75%)采用D,其支付矩阵如下表1。由于是一群鸟在博弈,那么每只鸟的每次博弈碰到另一只鸟采用H策略的概率就有25%,而碰到采用D策略的鸟的概率为75%,这样可以计算期望收益。假定z为鹰在整个种群中的比例(这里为0.25)。因此(1-z)即为鸽子所占的比例。鹰的收益期望为:
EV(H)=(-25z)+14(1-z)=14-39z
而鸽子的收益期望为:
EV(D)=(-9z)+5(1-z)=5-14z
这里,EV(H)=4.25,EV(D)=1.5。种群收益与种群的繁殖是成比例的,所以两个种群都会不断增长。显然,鹰的增长速度要快于鸽子。这样,鹰和鸽子的比例就会改变,最后,鹰和鸽子的比例会是多少呢?这就是一个演化战略,即ESS.8.3最优反应动态1、协调博弈的快速学习模型(表2)这个博弈称为协调博弈(coordinationgame),有两个NE:(A,A),(B,B)。后者明显帕累托由于前者。通常的预测结果是(B,B)。如果考虑风险因素,那么前者是更好的预测。由于现实中的理性是不完全的,因此要在有限理性的基础上来分析这个模型。假设有5个局中人环山而居,如图1。每个人都与左右邻居反复博弈。由于每个人是有限理性的,所以,第一次可能既采用A,也可能采用B策略。初次博弈总共有32种情况(?),右边给出了两种情况。32种中有不少实质上是相同的,根据采用A策略的数量和分布,总共有“0A”、“1A”、“2A相邻”、“2A不邻”、“3A相连”、“3A不相连”、“4A”、“5A”共8中情况。5个局中人从各种可能的初次博弈情况出发,在反复学习调整过程中,最终结果会怎么样?是否初始博弈的情况不同,收敛性和稳定状态也会不同假设xi(t)为在t时期的邻居中i采用策略A邻居的数量,该数量有0、1、2三种可能。采用B邻居的数量相应为2-xi(t),也有0、1、2三种可能。针对第t期的情况,i采用A的得益为:xi(t)*50+[2-xi(t)]*49=xi(t)+98,采用B则得益为:xi(t)*0+[2-xi(t)]*60=120-60xi(t)。因此根据最优反应动态机制,当xi(t)+98>120-60xi(t)时,即xi(t)>22/61,局中人i在t+1期会采用A;而当xi(t)<22/61时,会采用B策略。由于xi(t)只能取0、1、2,所以,i在t期,如果邻居中有采用A的,下一期也采用A,如果没有,下一期就采用B。这里i在下一期采取的策略跟上一期没有关系。5个局中人都适应上述规则,所以,初次
文档评论(0)