网站大量收购闲置独家精品文档,联系QQ:2885784924

数据挖掘课件分类方法.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

AQR算法有关定义AQR为每一个分类推导出一条规则,每一条规则形式如下:ifcoverthenpredictclass。在一个属性上的基本测试被称为一个Selector。下面是一些Selector的例子:Cloudy=yes或Temp60。AQR允许测试做{=,≤,≥,≠}。Selectors的合取被称为复合(Complex),Complexes之间的析取被称为覆盖(Cover)。如果一个表达式对某个样本为真,则我们称其为对这个样本的一个覆盖。这样,一个空Complex覆盖所有的样本,而一个空Cover不覆盖任何样本。在AQR中,一个新样本被区分是看其属于哪个推导出来的规则。如果该样本只满足一条规则,则这个样本就属于这条规则;如果该样本满足多条规则,则被这些规则所预测的最频繁的分类被赋予这条规则;如果该样本不属于任何规则,则其分类为样本集中最频繁的分类。第37页,共54页,星期六,2024年,5月AQR算法描述算法4-5AQR输入:正例样本POS;反例样本NEG。输出:覆盖COVER。(1)COVER=Φ;//初始化COVER为空集Φ(2)WHILECOVERdoesnotcoverallpositiveexamplesinPOSDOBEGIN(3)SelectaSEED;/选取一个种子SEED,例如没有被COVER覆盖的一个正样例(4)CallprocedureSTAR(SEED,NEG);//产生一个能覆盖种子而同时排除所有反例的星(5)SelectthebestComplexBESTfromtheSTARaccordingtouser-definedcriteria;/*从星中选取一个最好的复合*/(6)AddBESTasanextradisjucttoCOVER/*把最好的复合与COVER合取,形成新的COVER*/(7)END(8)RETURNCOVER.在算法AQR中调用了过程STAR,来排除所有的反例,产生覆盖种子的星。第38页,共54页,星期六,2024年,5月AQR算法描述(续)算法4-6STAR输入:种子SEED;反例NEG。输出:星STAR。(1)初始化STAR为空Complex(2)WHILEoneormoreComplexesinSTARcoverssomenegativeexamplesinNEGBEGIN/*如果STAR中的一个或多个Complex覆盖NEG中的负样例*/(3)SelectanegativeexampleEnegcoveredbyaComplexinSTAR;/*选取一个被STAR中的Complex覆盖的负样例*/(4)LetEXTENSIONbeallSelectorsthatcoverSEEDbutnotENEG;/*令EXTENSION为那些覆盖SEED但不覆盖ENEG的Selectors;*/(5)LetSTARbetheset{x∧y|x∈STAR,y∈EXTENSION};/*令STAR={x∧y|x∈STAR,y∈EXTENSION};*/(6)RemoveallComplexesinSTARsubsumedbyotherComplexesinSTAR;/*从STAR中除去被其他Complexes所包含的Complexes;*/(7)RemovetheworstComplexesfromSTARUNTILsizeofSTARislessthanorequaltouser-definedmaximum(maxstar)/*删除STAR中最坏的Complex直到STAR的大小等于或小于用户定义的最大数目maxstar*/(8)END(9)RETURNSTAR./*返回一系列覆盖SEED但不覆盖NEG的规则*/第39页,共54页,星期六,2024年,5月AQR算法举例假设现有一个训练集,其包含两种属性:size(属性值:micro,tiny,mid,big,huge,vast)type(属性值:bicycle,motorcycle,car,prop,jet,glider)现有正例、反例样本分别如表4-6,表4-7所示:下面给出用AQR算法对giant2-wheeler类的规则进行获取过程,具体步骤如下:(1)COVER={}。(2)空cover不覆盖任何样本,

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档