改进的使用非负矩阵分解的隐私保护分类方法.PDF

改进的使用非负矩阵分解的隐私保护分类方法.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
改进的使用非负矩阵分解的隐私保护分类方法

Computer Engineering and Applications 计算机工程与应用 2015 ,51(21 ) 1 ⦾博士论坛⦾ 改进的使用非负矩阵分解的隐私保护分类方法 李 光,惠 萌 LI Guang, XI Meng 长安大学 电子与控制工程学院,西安 710064 School of Electronic and Control Engineering, Chang ’an University, Xi ’an 710064, China LI Guang, XI Meng. Improved privacy-preserving classification method using non-negative matrix factorization. Computer Engineering and Applications, 2015, 51 (21 ):1-5. Abstract: In existing privacy-preserving data mining method based on NMF (Non-Negative Matrix Factorization ), every sample is equally important, and is perturbed with same degree. For solving this problem, a new method using sample selection and based on NMF is proposed. This method uses sample selection to divide samples into two parts: the important samples and the unimportant samples. Both important and unimportant samples are perturbed by using the existing NMF- based method. And then, unimportant samples are perturbed additionally by using the clustering properties of the NMF. The experiments show that, when keeping data utility, this new method can protect privacy well. Key words: privacy protection; data mining; data perturbation; non-negative matrix factorization; sample selection; classification 摘 要:针对现有的基于非负矩阵分解的隐私保护数据挖掘方法中,不区分样本的重要性的不同,对所有样本都进 行同样强度扰动的问题进行改进。提出了一种结合样本选择的基于非负矩阵分解的隐私保护分类方法。该方法使 用样本选择将原始样本区分为重要的和不重要的两类。在对数据进行扰动时,使用现有的基于非负矩阵分解的方 法对所有样本进行扰动。随后利用非负矩阵分解的聚类性质,对不重要的样本进行附加扰动。实验表明,该方法在 保持数据可用性的同时,可以对隐私信息提供更好的保护。 关键词:隐私保护;数据挖掘;数据扰动;非负矩阵分解;样本选择;分类 文献标志码:A 中图分类号:TP391 doi :10.3778/j.issn. 1002-8331.1507-0097 1 引言 该类方法的基本思想是认为数据挖掘重点关注数 近年来,数据挖掘中的隐私保护技术得到了普遍关 据的趋势信息,而隐私泄露需要较为具体的数据值。如 注。普通的数据挖掘技术假定数据是可以直接得到的, 果能够把那些对于数据挖掘来讲不重要的细节信息删 但是很多时候,这与隐私保护的要求相冲突。为了保护 除掉,数据依然可以用于数据挖掘,但已经发生了较大 隐私,某些数据是不能直接公开的。为了调和这一矛盾, 的变化,已经很难恢复出原有的数据值。因此可以在保 隐私保护数据挖掘的概念被提出[1-2] 。隐私保护数据挖

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档