10.演化博弈近年原文.ppt

下载文档

0
0
约9.48千字
约 30页
2024-12-01 发布于湖北
举报
版权申诉
保障服务

10.演化博弈近年原文.ppt

1、本文档共30页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第8章演化博弈凤凰鸣兮，于彼高岗；梧桐生兮，于彼朝阳。一群人鱼贯进入一个房间参加一个聚会，门口有多种不知道品牌的饮料，颜色也相差不大，每个人倒一杯饮料进入房间，最后，这几种饮料剩余的情况是怎么样的呢？游戏：每个人写一个1~100中的一个整数，最后，最接近平均数的2/3的人获得优胜。8.1有限理性在新古典经济学和大多数的博弈论中都假定，人是追求收益最大化的，并且可以无误地选择最优反应战略。但很多人认识到人的真实理性是有限的。赫伯特·西蒙研究认为，如果人们在某一问题有满意解时，就不会再去寻找最优解。在经典博弈论中，假设参与人具有使自己支付最大化的主观意识与对于对手策略的最优反应能力，在实际中，这种假设可能是不现实的。譬如在“象棋”中，棋手不可能在每一步都能够采取最优的反应行动。因而有必要把参与人的完全理性行为假设推广为不完全理性行为的假设。在演化博弈中，认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体，动植物参与者的支付可被了解为某种适应程度。把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。这个领域的开创性工作是由英国生物学家约翰·梅纳德·史密斯（JohnMaynardSmith）和G.R.普里斯（G.R.Price）1973年进行的。演化博弈现在正逐渐被广泛应用于社会经济学领域。经典博弈中的完全理性与现实相差太远。众多人类行为表现出人的理性是有限的，由于受认知能力的限制，有限理性的人类通常是根据习惯、常规以及经验法则行事，人类不可能如博弈论所描述的那样，通过复杂的计算获得最佳反应战略。但是，人类懂得学习，通过学习来比较，纠正错误，所以说，人类又是理性动物。从某种意义上来说，人类的学习和生物的演化没有本质区别，将进化论思想引入到博弈论，形成了演化博弈论。1973年，约翰?梅纳德?史密斯（JohnMaynardSmith）提出演化博弈论。爱克斯罗德以竞赛的方法，让持不同策略的对手把策略编成程序，在计算机上轮流相遇，反复进行囚徒困境博弈模拟的循环赛，并累计各自得分，以别胜负。这样的竞赛进行了两次。第一次参赛的有15种策略，分别出自经济学、心理学、社会学、政治学和数学领域的专家。循环赛的结果出人意料——获得冠军的是“针锋相对”（TFT）策略。这个策略是以诚信开始，然后跟踪对方上一步的策略，以诚信回报诚信，以欺骗报复欺骗。得分名列前茅的程序有如下三个特点：①从不首先选择欺骗，即策略是“善良的”；②对于对方的欺骗一定要报复，即“可激怒的”；③不能人家一次背叛，就没完没了地报复，以后只要人家改过，也要合作，即“宽容的”。第二次比赛吸引了来自6个国家的63个程序参加，比赛结果，第一名仍是TFT策略程序。这一次，艾克斯罗德又进行了总结，发现在63个程序中的前15名，只有第8名的程序是“不善良的”（或者说是“恶意的”），而后15名中只有一个是“善良的”。而前面总结的三个特点仍然有效，可激怒性和宽容性也得到了证明。在这里还有一个启示：TFT策略的成功是以对方成功为基础的，选择TFT的选手，在与某一个对手博弈时，得分不可能超过对手，最多是与对手打个平手，但他的总分最高。他赖以生存的基础很牢固，因为他让对手得了高分。关于信任博弈Berg等人于1995年首先对信任博弈进行了研究，假设两个参与者P（提议者，Propose）和R（响应者,Responder），P首先从实验组织者那里得到数量为m的钱，然后自行决定把数额为x的钱交给R（0≤x≤m）。实验者再把3x的钱奖励给R。最后，R可以自由返回给P数额为y的钱。根据逆向归纳法，实验的结果应该是：不管P给了R的x是多少，R的最优策略是y=0，因此P的最优策略应该是x＝0。但实验的实际结果完全不是这样，大部分的提议者总会把一定数量的钱交给R,而大部分的R也会把一部分奖励分给P，而且，x和y之间有很强的正相关。8.2引例：鹰鸽博弈1、鹰鸽博弈鹰鸽策略模型是博弈中的一个经典模型。为了争夺资源（比如土地、食物、政权、配偶等），群体中的成员之间要进行斗争，设每个成员为博弈中的局中人，局中人可以采取两种策略，一种是恶意的强硬进攻策略“攻击对方”（不顾一切争斗下去，直到一方失败退出竞争为止），称之为“鹰策略”，用“H”表示；另一种是善意的平和宽容策略“和平相处”（允许对方分享利益，不主动争斗，在对方进攻时只是虚张声势地吓唬一番，一旦争斗起来，为避免两败俱伤，采取退让策略，但也可能给予一定的报复），称为“鸽策略”，用“D”表示。2、假设有一群鸟，一部分（25%）采用H，另一部分（75%）采用D，其支付矩阵如下表1。由于是一