- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计 算 机 学 报
CHINESE JOURNAL OF COMPUTERS
面向深度强化学习的对抗攻防综述
1) 1) 1) 1) 1) 2) 3) 4)
刘艾杉 郭骏 李思民 肖宜松 刘祥龙 陶大程
1)(北京航空航天大学复杂关键软件环境全国重点实验室 北京 100191)
2)( 中关村实验室 北京 100094)
3)(合肥综合性国家科学中心数据空间研究院 安徽 230000)
4)(京东探索研究院 北京 100176)
摘 要 深度强化学习技术以一种端到端学习的通用形式融合了深度学习的感知能力与强化学习的决策能力, 在多个领域
得到了广泛应用, 形成了人工智能领域的研究热点. 然而, 由于对抗样本等攻击技术的出现, 深度强化学习暴露出巨大的安
全隐患. 例如, 通过在真实世界中打印出对抗贴纸便可以轻松地使基于深度强化学习的智能系统做出错误的决策, 造成严重
的损失. 基于此, 本文对深度强化学习领域对抗攻防技术的前沿研究进行了一次全面的综述, 旨在把握整个领域的研究进展
与方向, 进一步推动深度强化学习对抗攻防技术的长足发展, 助力其应用安全可靠. 结合马尔科夫决策过程中可被扰动的空
间, 本文首先从基于状态、基于奖励以及基于动作角度的详细阐述了深度强化学习对抗攻击的进展; 其次, 通过与经典对抗
防御算法体系进行对齐, 本文从对抗训练、 对抗检测、 可证明鲁棒性和鲁棒学习的角度归纳总结了深度强化学习领域的对
抗防御技术; 最后, 本文从基于对抗攻击的深度强化学习机理理解与模型增强的角度分析了对抗样本在强化学习领域的应用
并讨论了领域内的挑战和开放研究方向.
关键词 对抗样本; 对抗攻击; 对抗防御; 深度强化学习; 模型鲁棒性
中图法分类号 TP391
A Survey on Adversarial Attacks and Defenses for Deep Reinforcement
Learning
LIU Ai-Shan1) GUO Jun1) LI Si-Min1) XIAO Yi-Song 1) LIU Xiang-Long 1) 2) 3) TAO Da-Cheng 4)
1)(State Key Laboratory of Software Development Environment, Beihang University, Beijing, 100191)
2)(Zhongguancun Laboratory, Beijing, 100194)
3)(Institute of Dataspace, Hefei, Anhui, 230000)
4)(JD Explore Academy, Beijing, 100176)
Abstract With the spreading of deep learning, deep reinforcement learning technique has been widely used and
drawn extensive research at
您可能关注的文档
最近下载
- 湘美版(2024)七上 2.凝聚的力量 课件.pptx
- (完整)服装缝纫工初级理论知识试卷.pdf VIP
- 中国脑卒中护理指导规范.pptx VIP
- 2015必威体育精装版七年级上册英语《Unit1What-does-he-look-like》课件(鲁教版)-(一).ppt VIP
- 资源综合利用企业耗用废弃原料占比及产品产销情况表.docx
- 附件1 国家重点研发计划课题绩效自评价报告模板(2019).doc VIP
- 《出纳实务》教学教案.doc VIP
- 小学中秋节安全教育主题班会.pptx
- 2024年湖北省襄阳襄城区事业单位统一公开招聘33人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- (部编)八年级上册第二单元教案教学设计.doc
文档评论(0)