面向深度强化学习的对抗攻防综述.pdf

下载文档

0
0
约11.26万字
约 25页
2023-09-27 发布于宁夏
举报
版权申诉
保障服务

面向深度强化学习的对抗攻防综述.pdf

1、本文档共25页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机学报 CHINESE JOURNAL OF COMPUTERS 面向深度强化学习的对抗攻防综述 1) 1) 1) 1) 1) 2) 3) 4) 刘艾杉郭骏李思民肖宜松刘祥龙陶大程 1)(北京航空航天大学复杂关键软件环境全国重点实验室北京 100191) 2)( 中关村实验室北京 100094) 3)(合肥综合性国家科学中心数据空间研究院安徽 230000) 4)(京东探索研究院北京 100176) 摘要深度强化学习技术以一种端到端学习的通用形式融合了深度学习的感知能力与强化学习的决策能力, 在多个领域得到了广泛应用, 形成了人工智能领域的研究热点. 然而, 由于对抗样本等攻击技术的出现, 深度强化学习暴露出巨大的安全隐患. 例如, 通过在真实世界中打印出对抗贴纸便可以轻松地使基于深度强化学习的智能系统做出错误的决策, 造成严重的损失. 基于此, 本文对深度强化学习领域对抗攻防技术的前沿研究进行了一次全面的综述, 旨在把握整个领域的研究进展与方向, 进一步推动深度强化学习对抗攻防技术的长足发展, 助力其应用安全可靠. 结合马尔科夫决策过程中可被扰动的空间, 本文首先从基于状态、基于奖励以及基于动作角度的详细阐述了深度强化学习对抗攻击的进展; 其次, 通过与经典对抗防御算法体系进行对齐, 本文从对抗训练、对抗检测、可证明鲁棒性和鲁棒学习的角度归纳总结了深度强化学习领域的对抗防御技术; 最后, 本文从基于对抗攻击的深度强化学习机理理解与模型增强的角度分析了对抗样本在强化学习领域的应用并讨论了领域内的挑战和开放研究方向. 关键词对抗样本; 对抗攻击; 对抗防御; 深度强化学习; 模型鲁棒性中图法分类号 TP391 A Survey on Adversarial Attacks and Defenses for Deep Reinforcement Learning LIU Ai-Shan1) GUO Jun1) LI Si-Min1) XIAO Yi-Song 1) LIU Xiang-Long 1) 2) 3) TAO Da-Cheng 4) 1)(State Key Laboratory of Software Development Environment, Beihang University, Beijing, 100191) 2)(Zhongguancun Laboratory, Beijing, 100194) 3)(Institute of Dataspace, Hefei, Anhui, 230000) 4)(JD Explore Academy, Beijing, 100176) Abstract With the spreading of deep learning, deep reinforcement learning technique has been widely used and drawn extensive research at