- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于改进属性频度的属性约简算法
第 25卷第 5期 电 力 科 学 与 工 程 Vo1.25.No.5
2009年 5月 ElectricPowerScienceandEngineering May,2009
基于改进属性频度的属性约简算法
欧芳芳 ,马晓辉 ,马利芳 ,王翠茹
(1.华北电力大学计算机科学与技术学院,河北保定071003;2.邯郸峰峰矿区供电公司,河北邯郸056200)
摘要:对粗糙集理论的基本概念和相关定理进行了研究,针对 目前常用的属性频度约简算法的缺陷,提出
了一种改进算法;通过实例对改进算法的有效性进行了分析和验证。
关键词:粗糙集;属性约简;可辨识矩阵
中图分类号:TP391 文献标识码:A
有认知能力的主体的分类能力,并用等价关系形式
0 引 言 化表示分类 。
定义 1:1个信息系统可表示为 1个4元组
粗糙集 n最初 由波兰数学家于 1982年提出,
= A, (1)
作为一种处理不精确与不完全数据的新的数学理
论,到2O世纪90年代初 已引起各 国学者的关注。 式中 , ,…, )为非空有限集,即论域;
粗糙集理论建立在分类机制的基础上,它将知识理 是有限属性集; × ×..·表示属性 的值
解为对数据的划分,且是在特定空间上由等价关系 域; 表示属性 a的值域;F: 一 指定 中
构成的划分。近年来,已被广泛应用到人工智能、 每个对象属性值的信息函数。
模式识别和数据挖掘等方面。 定义 2:对定义 1中的信息系统 ,若有
属性约简是粗糙集理论的核心内容之一,它要 A=COD,且CAD=(2j,其中C和D分别为条件属
求在保持知识库的分类和决策能力不变的条件下, 性集和决策属性集,则称该信息系统为决策系统或
删除不相关或不必要的属性。人们期望找到最小约 决策表 。
简,但 由于属性组合的爆炸问题,导致了属性约简 定义3:对于 的任何属性子集 ,其在 上
是一个 NP—hard问题 。目前,主要的解决办法 的不可分辨关系 (又称等价关系)为
是引入启发信息到属性约简中,减小样本的有哪些信誉好的足球投注网站空 )={ )∈Ux :F(x,口)=, ,口),VaEB}(2)
间,从而达到提高约简效率的目的。
定义4:令P和Q为 中的等价关系,Q的
本文提出基于可辨识矩阵的属性频度算法。该
P正域为
算法以可辨识矩阵中出现次数多少作为属性重要性
POSp(Q)=【理(Q) (3)
的判断依据,但却存在着缺陷和不足:即当达到最
大频度的属性有多个时,从中任选一个添加到核属 定义5:设P和 Q为 中的2个等价关系簇,
性中得到的约简,有可能不是决策表的较优约简。 且QCp,如果满足:
针对这种情况,提出了一种改进算法。最后通过实 (1)Ind(P)=Ind(Q),(2)Q 是独立的,则称
例验证了改进算法的有效性和可行性。 Q是尸的1个约简。显然可知尸可以有很多个约
简,尸中所有必要关系组成的集合,称为尸的核,
1 粗糙集基本理论 表示为:Core(P)。
文档评论(0)