区块链驱动的联邦学习总结.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

区块链驱动的联邦学习总结

摘要

伴随着机器学习和人工智能发展产生的隐私问题,联邦学习(Federatedlearning,FL)逐渐

受到关注。在FL范式中,中央服务器和本地终端设备通过交换模型更新而不是原始数据来

维护相同的模型,因此存储在终端设备上的数据的隐私不会被直接泄露。这种方式有效减

轻了因敏感数据收集而成的隐私泄露。然而,具有中央服务器的FL的性能逐渐达到瓶颈,

并伴随着新的问题产生。原因包括最重要的是中心化处理、数据假和缺乏激励机制。为

了加速FL的推广,基于区块链的FL引起了学术界和工业界的广泛关注。涌现了大量新颖的

解决方案,以满足不同场景的新兴需求。区块链支持的FL提供了从各个角度提高FL性能的

理论和技术。本次报告,将总结和评估区块链驱动的FL,出现的新的挑战,以及潜在的改

进方向。

关键词:联邦学习,区块链,攻击抵抗,中心化

1引言

近年来,随着计算能力、算法和数据量的巨大提升,人工智能(ArtificialIntelligence,AI)、

机器学习(MachineLearning,ML)方法的发展极大地丰富日常生活。然而实际上,机器学习

需要大量高质量的数据来支持。绝大多数商业企业都面临着数据量低、质量差的困境,导致高

质量的机器学习技术难以全面实现和开发。

随着大数据时代的到来,数据就是财富。因此,数据隐私保护和安全已成为当下重要的问

题之一。数据隐私保护问题同样影响着由机器学习算法开发的应用程序。从行业角度来看,由

于行业竞争、隐私安全问题、复杂的管理流程等问题,数据往往以数据孤岛的形式存在。即使

是实现同一公司不同部门之间集成数据、实现数据互联也面临着诸多障碍。事实上,整合分散

在各个地方和机构的数据几乎是不可能的,而且所涉及的成本巨大。因此,这种数据隔离场景

也给ML算法的开发带来了巨大挑战。

FL也称为联合ML、联合学习(jointlearning)或联盟学习(alliancelearning),是一个ML框

架,可以有效帮助多个组织进行数据使用和ML模型训练,同时满足用户隐私保护、数据安全和

政府法规的要求。这一概念最早由Google于2016年提出,旨在解决Android手机终端用户本地更

新机型的问题。其设计目标是保证大数据交换过程中的信息安全,保护终端数据和个人数据隐

[11][10]

私。现有FL研究主要关注FL优化以减少通信开销和异构性问题。除此之外,FL仍然面临

着三个关键的缺点:本地训练的ML模型的集中处理、容易受到数据篡改以及缺乏对参与节点

的激励机制。

为了克服这些缺点,基于区块链的FL应运而生。对于区块链来说,它是一个公共账本,区

块链网络中的每个节点都具有平等的权重地位,通过达成共识并在本地记录公共账本来共同维

1

图1:使用设备私有数据生成聚合全局ML模型的FL训练策略[18]

护社区,可在不可信的场景中实现信任。区块链的优势特征可以减轻FL的三个已确定挑战的负

面影响:区块链的去中心化和高可扩展性特性允许完全或部分去中心化的FL,从而避免可能

的中间人攻击、单点故障等[24]。内置的激励机制和高可用性保证了终端设备,尤其是高性能

[8]

终端设备的高参与积极性。此外,区块链的真实性、拜占庭弹性、持久性和匿名性共同有助

[8]

于FL安全和隐私保护水平的提升。

2相关工作

2.1联邦学习

在经典的FL策略中,在每轮通信中,选择总共K个参与设备中的一小部分m来训练服务器

tt+1被上到FL服

发送的初始或聚合模型w,t=0,1,...。然后,第k个设备上的每

文档评论(0)

170333868030ac7 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档