- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
粗集中的属性选算法及优化方法
摘要
摘 要
选择、模式识别、机器学习、决策分析等领域.基于粗糙集技术的数据挖掘是通过属性
约简来实现的,属性约简算法可粗略地分为三类:前向属性约简算法、后向属性约简算
法和其他属性约简算法(如基于区分矩阵的属性约简算法).前向属性约简方法得到的
约简大多都存在冗余属性,本文对HORAFA属性约简算法进行改进,提出了一种新的基于
差别矩阵的前向选择算法,首先删除区分矩阵中属性重要性最小的属性,然后选择只包
含一个属性的矩阵元素,并将其加入到属性约简集合中,确保最终得到一个不存在冗余
属性的约简.对于后向属性约简方法,通过分析删除待删属性后得到的等价类的性质,提
出了一种以划分基数为停止基准的后向属性约简算法,运用该算法可以得到更少的决策
规则.通过分析集合覆盖的性质,对集合覆盖的概念进行了扩展,提出了新的集合覆盖概
念,并将其应用到基于区分矩阵的属性约简算法.针对前向属性约简算法在添加新属性
后,前续结果需重复计算的问题,提出了一种递归计算方法.在区分矩阵的建立过程中,
利用决策属性首先对实例集合进行划分,然后再建立区分矩阵,提高了建立区分矩阵的
效率.
关键词属性约简核属性选择前向选择后向选择
Abstract
Abstract
isanewdata
sets Z.Pawlak method,which
theory mining
Rough proposedoriginallyby
hasbeen in fields,such硒feature
successfullyappliedmany selection,patternrecognition,
machine basedon sets is
learning,decisionanalysis,etc.Datamining roughtechnique
reduction canbe claSsifiedinto
algorithm,whichroughly
aecomplishedbyuSiI冯attributes
three reduction reduction other
categories:forwardalgorithms,backwardalgorithms,and
reduction theattributereduction baSedon
algorithms(forexample algorithmsdiscernibility
obtainedforwardreduction retainsome
reducts
matrix).The by algorithmsusually
attributesfor has theHORAFA to
claSsification;this
dispensable paperimproved algorithm
withthelowest isdeleted
removethe
文档评论(0)