网站大量收购独家精品文档,联系QQ:2885784924

个kv匿名英文文献翻译.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
个kv匿名英文文献翻译

实现K-匿名隐私保护的概括和抑制 通常,一个数据保持器,如医院或银行,需要共享特定的人记录在这样一种方式,不能确定是数据的主体的人的个人的身份。实现这一点的方法之一是被发布的纪录坚持以K匿名为每个释放的记录,这意味着至少有(K-1)中的其他记录的发布,对这些领域中出现的外部数据,其值是模糊的。因此,K匿名提供隐私保护,保证每个释放的记录将涉及至少k个即使个人的记录直接链接到外部的信息。本文提供了一个正式的报告相结合的推广和抑制来实现k-匿名。泛化涉及更换或重新编码的值与一个具体的,但语义上一致的价值。抑制不释放值。优选的最小综合算法(名间等),这是一个理论本文提出的算法,这些技术结合起来,以提供k-匿名保护以最小的失真。现实世界中的算法Datafly和m-阿格斯比较名间。 Datafly和M-阿格斯使用启发式近似,因此,他们不总是产生最佳效果。结果表明,Datafly可以超过篡改数据和M-阿格斯还不能提供足够的保护。 关键词:数据匿名性,数据必威体育官网网址性,重新鉴定,数据融合,隐私。 介绍 今天的全球网络社会地方上的人许多新用途的特定数据的收集和共享的需求很大。发生这种情况的时候,越来越多的历史公共信息也是电子。当这些数据是连在一起的,他们提供的指纹身份和个人的信息,即使没有明确的标识,如姓名和电话号码,是一个人的电子图像。其他独特的数据,如出生日期,邮政编码,往往结合独特的,并可以链接到公开的信息重新识别个人。 所以,在今天的技术上的授权数据丰富的环境中,如何做数据持有人,如医疗机构,公共卫生机构,或金融机构,份额的人,具体的记录在这样一个方式是,发布的资料仍实用的,但身份的不能确定个人的数据对象是谁?实现这一点的方法之一是坚持k-匿名发布的信息。一个发布的数据说,坚持释放的记录,如果每个具有至少(K-1)其他记录也可见,在对一组特殊的称为“准标识符字段的值是模糊的释放的K-匿名。准标识符包含很可能出现在其它已知的数据集的那些字段。因此,K-匿名隐私保护保证每个记录涉及到至少k个人,即使释放出的记录直接连接(或匹配)外部信息。 本文提供了一个正式的演示,实现k-匿名的推广和抑制。泛化涉及更换或重新编码的值与一个具体的,但语义上一致的价值。抑制不释放值。虽然还有许多的技术available2,结合这两个提供了几个优点。 首先,一个接收者的数据可以被告知做什么来的数据。这结果从公布的数据可以得到合理的解释。二,信息报告,每个人是“真实的”,这使得到的数据可用于欺诈检测,反恐监视,医疗结果的评估和其他用途,包括可追溯的人patterns3。第三,这些技术可以提供保证不愿透露姓名的最低限度的扭曲的结果。任何企图以提供??匿名保护,无论程度如何,涉及到修改的数据,从而扭曲其内容,因此我们的目标是最低限度的扭曲。第四,这些技术可以使用喜好的收件人的释放的数据可以具有,从而提供最可能的有用的数据。在这种方式中,如何扭曲了数据的算法决定一个特定的任务,可以产生最小的影响对数据的健身。 最后,现实世界的的系统Datafly和M-ARGUS,这是讨论在随后的章节中,使用这些技术来实现k-匿名。因此,这项工作提供了一个正式的基础上,对它们进行比较。 2.背景 k-匿名的准标识符的想法很简单。然而,必须小心,恰恰说明是什么意思。提供了详细的讨论,k-匿名。在本节为背景,为即将到来的概括介绍和抑制提供一个简要的总结。 除非另有说明,术语“数据是指人的特定信息,在概念上被组织为一个表的行(或记录)和列(或字段)。每一行称为一个元组。在一个表中的元组不一定是唯一的。每一列被称为一个属性和表示语义类别的信息是一组可能的值,因此,一个属性也是一个域。在一个表中的属性是唯一的。因此,通过观察一个表中,每一行是一个有序的n元组的值d1, d2,…,DN使得每个值d j的第j列中的域,对于j =1,2,...,n,其中n是列的数目。这相当于关系数据库的概念。 设B(A1,...,An)的表与有限数量的数组。B的属性的有限集合为{A1,...}。给定一个表B(A1,…,An), {Ai,…,Aj} ??{A1,…,An},和数组t?B,,我用 t[Ai,…,Aj] 来表示的序列的值,vi,…,vj, of Ai,…,Aj in t。用B [ Ai,...,Aj]表示投影,保持重复数组Ai…Aj在B中的属性。 这项工作的每个元组被认为是特定的一个人,没有两个元组涉及的是同一个人。这一假设简化没有损失的适用性讨论。此外,本次讨论的重点保护身份的人的具体数据,但只是适用于保护其他类型的实体信息(例如,公司或政府)的其他种类的。 限制链接(或比赛)公布的数据,其他外部信息的能力提供隐私保护。中的私人信息,可用于连接与外部信息的属性

文档评论(0)

xiaoxue8 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档