- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DataExtractionandModelStealing姜育刚,马兴军,吴祖煊
Recap:week7ABriefHistoryofBackdoorLearningBackdoorAttacksBackdoorDefensesFutureResearch
ThisWeekDataExtractionAttackDefenseModelStealingAttackFutureResearch
ThisWeekDataExtractionAttackDefenseModelStealingAttackFutureResearch
DataExtractionAttack通过模型逆向得到训练数据:8001/dss/imageClassify
TerminologyThefollowingtermsdescribethesamething:DataExtractionAttackDataStealingAttackTrainingDataExtractionAttackModelMemorizationAttackModelInversionAttack
SecurityThreatsMysocialsecuritynumberis078-PersonalInfoLeakageSensitiveInfoLeakageThreatstoNationalSecurityIllegalDataTrading…
MemorizationofDNNsEvidence1:DNNlearnsdifferentlevelsofrepresentations
MemorizationofDNNsEvidence2:DNNcanmemorizerandomlabels/pixels真实标签随机标签乱序像素随机像素高斯噪声Zhang,Chiyuan,etal.“Understandingdeeplearningrequiresrethinkinggeneralization.”ICLR2017.
MemorizationofDNNsEvidence3:ThesuccessofGANsanddiffusionmodels/;/
Intendedvs.UnintendedMemorizationIntendedMemorizationTask-relatedStatisticsInputsandLabelsArpitetal.“Acloserlookatmemorizationindeepnetworks.”?ICML,2017.Carlinietal.“Thesecretsharer:Evaluatingandtestingunintendedmemorizationinneuralnetworks.”USENIXSecurity,2019.第一层Filter正常CIFAR-10第一层Filter随机标注CIFAR-10自然语言翻译模型记忆:“我的社保号码是xxxx”UnintendedMemorizationTask-irrelevantbutmemorizedEvenappearonlyafewtimes出现4次就能全记住
现有数据窃取攻击
黑盒窃取主动测试:煤矿里的金丝雀“随机号码为****”“我的社保号码为****”主动注入,然后先兆数据在语言模型中的“曝光度”(Exposure)Carlinietal.“Thesecretsharer:Evaluatingandtestingunintendedmemorizationinneuralnetworks.”USENIXSecurity,2019.意外记忆测试和量化:’先兆’
黑盒窃取针对通用语言模型:逆向出大量的:名字、手机号、邮箱、社保号等大模型比小模型更容易记住这些信息即使只在一个文档里出现也能被记住Carlini,Nicholas,etal.“Extractingtrainingdatafromlargelanguagemodels.”?USENIXSecurity,2021.训练数据萃取攻击TrainingDataExtractionAttack
DefinitionofMemorizationCarlini,Nicholas,etal.“Extractingtrainingdatafromlargelangua
您可能关注的文档
- 数据与模型安全 课件 第3周:对抗样本.pptx
- 数据与模型安全 课件 第4周:对抗样本检测.pptx
- 数据与模型安全 课件 第5周:对抗防御.pptx
- 数据与模型安全 课件 第6周:数据投毒和防御.pptx
- 数据与模型安全 课件 第7周:后门攻击和防御.pptx
- 数据与模型安全 课件 第9周:隐私攻击和防御.pptx
- 数据与模型安全 课件 第10周:深度伪造与检测.pptx
- 数据与模型安全 课件 第11周:联邦学习.pptx
- 数据与模型安全 课件 第12周:AI模型版权保护.pptx
- 数据与模型安全 课件 第13周:AI公平性与伦理.pptx
- -高中语文 第6课辛弃疾词两首同步检测 新人教版必修4 .doc
- 高中物理 1.5 电势差练习 新人教版选修3-1.doc
- 高中英语 Unit4 Making the+news综合测试题 新人教版必修5.doc
- 高中数学 4-2-3 直线与圆的方程的应用能力强化提升 新人教A版必修2.doc
- 高中数学 第一次月综合素能检测 新人教A版必修1.doc
- 高中数学 3.4 简单线性规划(第1课时)练习 北师大版必修5.doc
- 高中数学 2-2-2 平面与平面平行的判定能力强化提升 新人教A版必修2.doc
- 高中数学 1-3-2 球的体积和表面积能力强化提升 新人教A版必修2.doc
- 高中数学 3.3 二元一次不等式组与简单的线性规划问题第3课时练习 .doc
- 高中数学 3.3 基本不等式(第1课时)练习 北师大版必修5.doc
文档评论(0)