面向隐私保护的数据挖掘和数据发布方法研究(童云海).ppt

面向隐私保护的数据挖掘和数据发布方法研究(童云海).ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 32 我们研究的重点 ? 微数据发布场景 ? 分析单一个体对应多个记录的情况,提出了身份保 持的匿名模型 ? 分析动态数据发布的场景和隐私推理途径,提出了t- rotation模型处理动态数据 ? 联机分析处理(OLAP)中的数据保护 ? 基于度量的OLAP数据隐私保护方法 ? 基于维度的OLAP数据隐私保护方法 CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 33 问题提出 ? 很多部门和单位(例如:医院)需要发布一些数据表。包 含个体信息的表称为微数据(microdata) ? 微数据是记录个人信息的数据 ? 身份标识属性(Individually Identifying Attribute ,简称ID ):记 录了可以唯一识别个人的取值,比如身份证号、电话号码、姓名 等信息 ? 准标识属性(Quasi-identifiers,简称QI):记录了对个人的一些 类型属性的取值,比如性别、所在的邮政编码、出生日期等 ? 敏感属性(Sensitive Attribute,简称ST):记录了个人不愿为人所 知的取值信息,比如个人收入、所患病症等 CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 34 问题提出:微数据发布场景 ? 为了提供研究,医院发布了一个病人情况表 ? 简单的方法:去掉“身份标识属性” publish CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 35 连接推理 发布表 Quasi-identifier (QI) attributes 选民登记表 An adversary CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 36 连接推理 ? [Swe00]的研究表明,87%的美国人口信息可以通过性 别、出生日期、5位邮政编码进行个人重建 ? 我们研究了宁波城区中的居民数据,得到了类似的结论 ? 78%的人口可以通过出生日期和6位邮政编码唯一确定 ? 58%的人口可以通过出生日期和5位邮政编码唯一确定 CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 37 问题定义(1) ? 设数据集的模式: T={ID1,…IDr,QI1,…,QIs,ST1,…,STt} ? IDi (i=1,2,…,r):身份标识属性 ? QIj (j=1,2,…,s):准标识属性 ? STk (k=1,2,…,t):敏感属性 ? 为了保护个人隐私,发布数据集需要设定一个隐私保护 需求ψ ? 为了达到隐私保护需求ψ,需要对数据集T中的元组t进 行转化得到t’,设转化函数为f CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 38 问题定义(2) ? 对转化函数f ? 设t=( d1,…dr,q1,…,qs,s1,…,st),f把t转化为t’ =( d1’,…dr’,q1’,…,qs’,s1’,…,st’),即t’=f(t)。 ? 通常在微数据发布处理方法中,f并不修改敏感属性 的取值,即sk=sk’,(k=1,2,…,t) ? 对于需要处理的数据集T,转化函数f把T转化为发布 数据集PT,其中PT={f(t)|t∈T}。转化后( q1’,…,qs’) 取值相同的那些元组形成一个QI分组。 ? 为了尽量准确地评价发布数据,需要建立评价指 标,设为σ CCF YOCSEF 报告会:数据挖掘及其在网络信息安全中的应用 39 问题定义(3) ? 隐私保护的数据发布问题可以表示为一个四元组PPDP=( T,ψ,f,σ) ? T是需要发布的数据集,发布的数据集为PT={f(t)|t∈T} ? ψ是隐私保护需求 ? f 是转化函数

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档