络博弈:合作的进化.pptVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Social learning 网络博弈:合作的进化 张博宇 北京师范大学数学科学学院 2014年6月30日 概述 1.社会困局 Social dilemma 2.演化动态 Evolutionary dynamics 3.网络博弈 Network game 4.网络上的合作 Cooperation on network 囚徒困境 囚徒困境博弈(Prisoner’s Dilemma game): 合作 C,支付c,对手获得b,其中bc; 背叛 D,不支付。 背叛是唯一的纳什均衡对策,但是合作对于群体更加有利。 公用品博弈 公共品博弈(Public goods game) 每名参与者可贡献他的一些私人资金作为公共经费,这些资金乘以系数r后平均分给所有N名参与者。 如果参与者i贡献ci,他的收益为: 当1rN时,每名参与者的最优对策均为不贡献(D),尽管贡献全部资金(C)对于整个群体更加有利。 社会困局(Social dilemma) 个体追求利益最大化导致了社会利益最小化。 一些符号 nC, nD, pC, fC, fD, hC, hD, ω, 其中fX=1-ω +ωhX. 基本假设 (1) 种群充分大。 (2) 无性繁殖。 (3) 个体两两随机相遇。 (4) 个体间无差异。 复制方程 (Replicator dynamics) 进化选择了背叛者。 演化动态 演化和学习 个体并非完全理性,模仿其他有更高收益的个体的行为。 成对模仿 (Pairwise comparison) 从种群中随机挑选两个个体i 和j,i为模仿者,j为被模仿者。若i个体观测到j个体有更高的收益,则他会以概率(fj - fi)+模仿j个体的行为。 学习动态(Learning dynamics) 演化动态的性质 (1) 纳什均衡一定是复制方程/学习动态的平衡点。 (2) 复制方程/学习动态的稳定平衡点一定是纳什均衡。 有限种群中的合作 种群大小固定为N。 随机相遇: 在完全随机相遇的固定大小种群中,合作者有更大的概率遇到背叛者。 小种群有利于背叛者的演化。 有限种群的演化动态 一步过程 每个时间步从种群中随机挑选一个个体i作为模仿者,再随机挑选一个个体j作为被模仿者。若i个体观测到j个体有更高的收益,则他会以概率(fj - fi)+模仿j个体的行为。 转移概率 演化动态 合作的进化 Sigmund K Nowak MA 亲缘选择 群体选择 直接互惠 间接互惠 网络博弈 网络博弈 有限种群 大小为N的种群分布在一张N个节点的网络上。每个节点或者是合作者(C),或者是背叛者(D)。 网络博弈 每个个体只与他的邻居进行博弈。一个个体的收益是他和所有邻居博弈获得收益的总和。 成对模仿 每个时间步从种群中随机挑选一个 个体i作为模仿者,再从他的邻居中 随机挑选一个个体j作为被模仿者。 i个体模仿j个体的行为的概率为 网络上的合作 为什么网络结构能够促进合作? 合作者聚集可以获得更高的收益,而背叛者聚集会降低收益。 网络博弈 网络特征: 网络节点集合 :I={1,…,N}. 节点i 的度数 :ki . 度数为k的节点的比例:p(k). 网络的平均度数: 网络度数分布的方差: 博弈特征: 节点i的行为:si . 节点i的A邻居和B邻居的个数:ki,A , ki,B . A行为个体在网络中所占的权重: AA边的比例:φAA. A节点的一个邻居为A和B的概率:qA|A, qA|B. 网络博弈的演化动态 暂态均衡(Temporal equilibrium) 当选择强度ω较弱时,网络上会形成暂态均衡状态。在此暂态均衡有qA|A-qA|B=1/(z-1),即度数为k的A个体平均比度数为k的B个体多k/(z-1)个A邻居。 演化动态 网络上的囚徒困境博弈 囚徒困境博弈 演化动态 规则网络(var(k)=0)不能促进合作。 合作(C)成为全局稳定的条件为 网络的方差越大越有利于合作的进化。当方差充分大时,合作产生的条件为b/cz-1. 网络上的合作 var(k)=187, var(k)=275 var(k)=15, var(k)=18 总结 完全随机相遇的种群中合作无法进化。 种群越小越不利于合作。 网络可以促进合作 网络的平均度数越小、方差越大,越有利于合作。 为什么网络可以促进合作? 由于网络结构的存在,合作者间和背叛者间都更容易聚集,这种聚集会提高合作者的收益,降低背叛者的收益。 人类社会中,网络结构可以促进合作么? 现有的几个网络博弈实验表明,网络结构对人类间的合作没有明显促进作用。 条件合作(Conditional cooperation) 玩家每一轮的选择依赖于上一轮自身的选择和周围邻居的

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档