论人类决策过程的进化模型（精简版）.pdfVIP

下载本文档

0
0
约1万字
约 8页
2024-08-06 发布于宁夏
举报
版权申诉

论人类决策过程的进化模型（精简版）.pdf

1、本文档共8页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

论人类决策过程的进化模型

摘要人既不同于简单的生物也不同于传统经济学所假定的完全理

性经济人，而是具有逻辑推理能力的高等智能生物。现实中参与人是

有限理性的，因而，其决策过程既不能利用简单的模仿者动态所能准

确描述的，也不能完全依赖于最优化计算，人类实际的决策过程是一

个复杂的模仿、学习的渐进过程。本文主要论述学术界对人类实际决

策过程研究成果，重点分析了两类学习模型即支付强化学习模型及信

念强化学习模型，并对后两类模

摘要人既不同于简单的生物也不同于传统经济学所假定的完全理

性经济人，而是具有逻辑推理能力的高等智能生物。现实中参与人是

有限理性的，因而，其决策过程既不能利用简单的模仿者动态所能准

确描述的，也不能完全依赖于最优化计算，人类实际的决策过程是一

个复杂的模仿、学习的渐进过程。本文主要论述学术界对人类实际决

策过程研究成果，重点分析了两类学习模型即支付强化学习模型及信

念强化学习模型，并对后两类模型在预测参与人决策的效果进行了比

较。关键词：最优化，模仿者动态，支付强化模型，信念强化模型引

言传统经济学建立于完全信息、理性人等假定基础上，此时参与人

就相当于功能良好的计算机，无论环境发生任何变化，理性人在既定

信息下总可以找到一条达到均衡的最优路径，所以传统理论根本不必

考虑达到均衡的路径，不必分析人类的决策过程，只需应用比较静态

法来研究均衡之间的关系。然而，现实中参与人并不满足完全理性要

求，信息也不可能获得，参与人在多数情况下并不可能进行最优化计

算。心理学家西蒙在研究生态演化现象时提出的模仿者动态模型

（ReplicatorDynamicsModel），详细讨论可以参阅文献。生态学

家在研究生态演化现象时，常常把同一生态环境中所有种群看作为一

个大群体而把其中的每一个种群都程式化单个纯策略，个体之间随机

配对且进行重复、匿名博弈；个体在博弈中所得的支付即适应度是用

其后代数量来表示的；假定个体是无性繁殖，即每一个后代都继承其

单亲的策略；更成功的种群其后代数在群体中所占的比例变得越来越

高而更不成功的种群体后代数会变得越来越低。模仿者动态模型是

在考察生态现象时提出来的，它能够较好描述生态演化的动态过程，

借用模仿者动态模型来描述参与人复杂的决策过程就需要作出相应

的转换。因为，在不考虑突变的情况下，生物行为一般是由其基因完

全决定，种群演化过程遵循简单的适者生存不适者淘汰规律，模仿者

动态模型在描述生物演化行为时获得了巨大的成功，这种简单的演化

动态用于描述参与人的行为时就显示出了局限性。首先，人是具有思

维能力、推理能力的高级智能生物，其行为方式远比其他生物复杂，

人的行为不仅受到其先天性遗传基因的影响，更重要的是受到后天学

习因素的影响。因此，由简单的模仿者动态难以描述参与人复杂的决

策过程。其次，由适应度而引致的动态过程是通过种群后代数的变化

而调整的，也就是说更成功的策略者会得到更多的后代，这就隐含了

频率的调整是一个自动过程，群体中个体是不需要经过选择的。在经

济过程中参与人的行为是通过复杂的学习过程来完成的，由适应度机

制来代替参与人学习机制需要对动态模型进行相应的改进。再次，在

模仿者动态模型中，群体的策略频率是根据他们的适应度来调整的，

结果所有高于群体平均支付的策略都有高于群体平均的速度增长，即

使这些策略并不是最优反应策略。在经济过程中，常常假定理性参与

人通过学习和模仿来选择其最优反应策略，在这一个过程中，只有选

择最优反应策略者才可能增长，这就提出了问题即：学习和模仿过程

是否仍然可以利用上述的模仿者动态方程来描述呢？最后，我们在什

么时候可以用学习和模仿机制来代替基因演化机制，在进化模型中，

有限理性的参与人可能不具有察觉由进化动态而引起循环的能力。当

然，模仿者动态可以描述人类简单的决策行为，但要更完整地描述参

与人复杂的决策行为就需要深入人类的学习过程进行更为深入的研

究。二、学习模型借用描述简单生态演化现象的进化博弈动态模型

来研究复杂的参与人决策过程，在多数情况都不会得到令人满意的结

论。人类具有一般生物所不具有的逻辑思维、推理及学习能力，人不

仅能够适应环境而且能够改造环境、创造环境，因此人类行为的演化

并不是纯粹生态意义上的进化，而是一种“文化的演进”（Cultural

Evolution）。人类为了适应自己所处的环境（包括自然环境及社会环

境）会充分发挥自己的主观能动性，他们不仅能够从过去一代或几代

的行为中吸取经验与教

您可能关注的文档

文档评论（0）

150****3135 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

论人类决策过程的进化模型（精简版）.pdfVIP