基于粗糙集的属性约简的矩阵方法.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于粗糙集的属性约简的矩阵方法.pdf

2006年9月 陕西理工学 院学报 S 2 6 ofShaa舣i 第22卷第3期 Jo啪al UIlive璐畸ofTecIulology Vd2叩2 N∞m 3 [文章编号】1673—2944(2006)03一0076—05 基于粗糙集的属性约简的矩阵方法 任艳玲1, 朱明放2 (1.陕西理工学院电子信息系,2.陕西理工学院计算机科学与技术系,陕西汉中723003) [摘要]粗糙集理论中,属性约简是知识挖掘的核心。知识获取是根据对象问的某种关系 如等价关系、相似关系等来定义。受关系的矩阵表示的启发,本文提出知识的矩阵表示以及属 性约简的矩阵方法,这种表示和约简方法具有形式简单规范、运算工整的特点。实例验证了该 方法的合理性和有效性。 [关键词] 粗糙集; 矩阵表示; 知识约简; 信息系统; 数据集 [中图分类号]TPl8 [文献标识码]A 从实际系统中采集到的数据常含着噪声,不够精确甚至不完整。采用纯数学的假设来消除或回避 这种不确定性,效果往往不理想,通过对这些信息进行统计学或模糊技术处理,有助于相关实际系统问 题的解决…。模糊集和基于概率方法的证据理论是处理不确定信息的两种方法,应用这些方法需要一 些数据的附加信息或先验知识,如模糊隶属函数、基本概率指派函数和有关统计概率分布等,而这些信 息有时并不容易得到。文献[2]首次提出了粗糙集理论,它是一种刻划不完整性和不确定性的数学工 具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发 现隐含的知识,揭示潜在的规律。 粗糙集理论中,“知识”被认为是一种分类能力。在分类过程中,将相差不大的个体归于同一类,对 象间的关系就是不可分辨关系,一种等价关系口j。粗糙集理论应用在完备的信息系统上,找到知识库 的等价类,进行挖掘知识任务。在现实生活中,信息系统常常是不完备的,这样直接应用粗糙集理论发 现不了等价类,不能有效地进行数据挖掘,所以需要重新考虑分类或决策规则提取的对象关系的定义, 即降低很强的等价关系的要求,提出如相容关系、相似关系或者更一般的关系,来适应知识获取的需要。 受关系的矩阵表示及关系运算的矩阵方法的启示,提出粗糙集理论在分类和决策规则获取中基本 概念的矩阵表示,属性约简和规则获取的矩阵运算方法,涉及完备信息系统和不完备信息系统。在不完 备信息系统中,仅讨论对象间的相容关系,但其思想并不仅限定这类关系。通过矩阵的形式表达,从更 一般的层次认识粗糙集在知识约简和规则获取中的应用。本文给出了相关定理和算法,结合几个实例 说明方法的有效性。 1 相关工作 粗糙集理论是以集合方式定义各种概念和运算,其应用大多数也是基于集合的方式。在粗糙集中 的概念,用两个精确集合一下近似集和上近似集来逼近,并给出描述精度,用于分类和决策规则的挖掘。 这种代数方式描述的概念和运算直观性差,且在应用上不方便。 文献[4]把论域上的等价关系看作是其上的一个随机变量,建立知识与信息熵之间的关系。文献 [5]粗糙集概念与运算的布尔矩阵表示,构造一个布尔矩阵和一个逻辑方程组,建立了粗糙集中属性集 与布尔矩阵及逻辑方程组的解之间的关系。这些工作有助于理解粗糙集的本质,为寻找高效的属性约 简算法奠定了基础。但是,属性约简算法都是先求出不可区分关系或者相容关系,然后逐个检验去掉某 收稿日期:2005一12一05 基金项目:陕西理工学院科研基金资助项目(0535)。 作者简介:任艳玲(1969一),女,陕西咸阳人,实验师,主要研究方向为数据通信技术。 万方数据 第3期 任艳玲,朱明放 基于粗糙集的属性约简的矩阵方法 个属性列后,对不可区分关系或相容关系的影响,若改变则该属性是重要的,否则不重要,予以删除,一 直这样循环试探,最后得到约简的属性集。这种试探是种组合问题,业已证明,它是NPc问题。 本文提出的粗约简的概念和算法是不直接求约简核,而是直接求出数据集的一个约简,从而,设法 快速得到约简后的知识系统,从而加速挖掘

文档评论(0)

我的文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档