论人类决策过程的进化模型(精简版).pdfVIP

论人类决策过程的进化模型(精简版).pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

论人类决策过程的进化模型

论人类决策过程的进化模型

摘要人既不同于简单的生物也不同于传统经济学所假定的完全理

性经济人,而是具有逻辑推理能力的高等智能生物。现实中参与人是

有限理性的,因而,其决策过程既不能利用简单的模仿者动态所能准

确描述的,也不能完全依赖于最优化计算,人类实际的决策过程是一

个复杂的模仿、学习的渐进过程。本文主要论述学术界对人类实际决

策过程研究成果,重点分析了两类学习模型即支付强化学习模型及信

念强化学习模型,并对后两类模

摘要人既不同于简单的生物也不同于传统经济学所假定的完全理

性经济人,而是具有逻辑推理能力的高等智能生物。现实中参与人是

有限理性的,因而,其决策过程既不能利用简单的模仿者动态所能准

确描述的,也不能完全依赖于最优化计算,人类实际的决策过程是一

个复杂的模仿、学习的渐进过程。本文主要论述学术界对人类实际决

策过程研究成果,重点分析了两类学习模型即支付强化学习模型及信

念强化学习模型,并对后两类模型在预测参与人决策的效果进行了比

较。关键词:最优化,模仿者动态,支付强化模型,信念强化模型引

言传统经济学建立于完全信息、理性人等假定基础上,此时参与人

就相当于功能良好的计算机,无论环境发生任何变化,理性人在既定

信息下总可以找到一条达到均衡的最优路径,所以传统理论根本不必

考虑达到均衡的路径,不必分析人类的决策过程,只需应用比较静态

法来研究均衡之间的关系。然而,现实中参与人并不满足完全理性要

求,信息也不可能获得,参与人在多数情况下并不可能进行最优化计

算。心理学家西蒙在研究生态演化现象时提出的模仿者动态模型

(ReplicatorDynamicsModel),详细讨论可以参阅文献。生态学

家在研究生态演化现象时,常常把同一生态环境中所有种群看作为一

个大群体而把其中的每一个种群都程式化单个纯策略,个体之间随机

配对且进行重复、匿名博弈;个体在博弈中所得的支付即适应度是用

其后代数量来表示的;假定个体是无性繁殖,即每一个后代都继承其

单亲的策略;更成功的种群其后代数在群体中所占的比例变得越来越

高而更不成功的种群体后代数会变得越来越低。模仿者动态模型是

在考察生态现象时提出来的,它能够较好描述生态演化的动态过程,

借用模仿者动态模型来描述参与人复杂的决策过程就需要作出相应

的转换。因为,在不考虑突变的情况下,生物行为一般是由其基因完

全决定,种群演化过程遵循简单的适者生存不适者淘汰规律,模仿者

动态模型在描述生物演化行为时获得了巨大的成功,这种简单的演化

动态用于描述参与人的行为时就显示出了局限性。首先,人是具有思

维能力、推理能力的高级智能生物,其行为方式远比其他生物复杂,

人的行为不仅受到其先天性遗传基因的影响,更重要的是受到后天学

习因素的影响。因此,由简单的模仿者动态难以描述参与人复杂的决

策过程。其次,由适应度而引致的动态过程是通过种群后代数的变化

而调整的,也就是说更成功的策略者会得到更多的后代,这就隐含了

频率的调整是一个自动过程,群体中个体是不需要经过选择的。在经

济过程中参与人的行为是通过复杂的学习过程来完成的,由适应度机

制来代替参与人学习机制需要对动态模型进行相应的改进。再次,在

模仿者动态模型中,群体的策略频率是根据他们的适应度来调整的,

结果所有高于群体平均支付的策略都有高于群体平均的速度增长,即

使这些策略并不是最优反应策略。在经济过程中,常常假定理性参与

人通过学习和模仿来选择其最优反应策略,在这一个过程中,只有选

择最优反应策略者才可能增长,这就提出了问题即:学习和模仿过程

是否仍然可以利用上述的模仿者动态方程来描述呢?最后,我们在什

么时候可以用学习和模仿机制来代替基因演化机制,在进化模型中,

有限理性的参与人可能不具有察觉由进化动态而引起循环的能力。当

然,模仿者动态可以描述人类简单的决策行为,但要更完整地描述参

与人复杂的决策行为就需要深入人类的学习过程进行更为深入的研

究。二、学习模型借用描述简单生态演化现象的进化博弈动态模型

来研究复杂的参与人决策过程,在多数情况都不会得到令人满意的结

论。人类具有一般生物所不具有的逻辑思维、推理及学习能力,人不

仅能够适应环境而且能够改造环境、创造环境,因此人类行为的演化

并不是纯粹生态意义上的进化,而是一种“文化的演进”(Cultural

Evolution)。人类为了适应自己所处的环境(包括自然环境及社会环

境)会充分发挥自己的主观能动性,他们不仅能够从过去一代或几代

的行为中吸取经验与教

文档评论(0)

150****3135 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档