网站大量收购独家精品文档,联系QQ:2885784924

基于粗糙集的缺失数据填补技术研讨.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机科学2007V01.34No.8A 基于粗糙集的缺失数据填补技术研究*) 窦东阳赵英凯 (南京工业大学自动化学院 南京210009) Abstract data indata 1eadstobadresultsof Data be- Missingbringsmanyproblemsmining,and knowledgefilling comesan ofdata of setin with anduncertain importantpart mining.Takingadvanmgerough dealinguncompleted data arithmeticbasedon setiS the of problems.atwo-stepfilling rough presented.A』terreducingdegreeimpedec— tion relation.datasheetis andclassed.Themost valtieisusedtOfillthe usingcompatibility decomposed possible data.It’S to validall atlast. be missing approved by example set,Data KeywordsRough missing,Datafilling,Dat.amining 也是一种等价关系,称为不可分辨关系,记为JND 1 引言 计算机技术的进步使得人们积累的数据量爆炸 示出知识的粒度性,产生了关于不精确的“边界”思 式增长,但知识却难以获取。大量数据堆积起来形 想。粗糙集中的模糊性就是一种基于边界的概念, 成“数据坟墓”,如何将其转换成知识“金块”,数据挖 是由不确定性来描述的。 掘技术应运而生,它从海量数据中提取或“挖掘”知 粗糙集的知识表达一般采用信息表或信息系统 识,供决策之用。然而,存在不完整的,含噪声的和 的方式,记为S=(U,A,V,p,其中己,为对象的非 不一致的数据是大型的、现实世界数据库或数据仓 空有限集合,即论域,A为属性的非空有限集合,V 库的共同特点。普遍存在的规律是:数据质量越好, 为属性的值域,厂为信息函数,它为每个对象的每个 挖掘的结果也越准确。因此,数据预处理是数据挖 属性赋予一个信息值。特别的,信息系统如果表示 掘过程的重要阶段。对于缺失数据的处理,已有许 为工一(U,CUD)的形式,其中C和D分别为条件 多方法,比如MeanCompleter算法、Combinatorial 属性集和决策属性集,就称为决策系统。在S或I Completer算法等。这里提出一种基于粗糙集的方 中,如果至少有一个属性口∈A使得%含有缺失值 法,在第一步利用相容关系降低不完备程度后,第二 *,则称为不完备系统,否则是完备的。 步将数据表分解、逐层分类,再在细化的类中使用最 可能的值填补缺失数据,完备我们的决策系统。 3基于粗糙集的两步填补算法 2理论基础 粗糙集处理不精确问题最大的优点是只使用数 据集自身的信息,不依赖假设的模型或参数,因此对 粗糙集是由波兰学者Pawlak在

您可能关注的文档

文档评论(0)

精品课件 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档