数据挖掘简单概括.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

6.2决策树分类算法决策树的建立--决策树建立步骤(例)计数收入学生信誉归类:买计算机?60中否良买64低是良买64低是优不买132中是良买63中否优不买1中否优买年龄青中老买学生计数收入信誉归类:买计算机?64低良买64中优买计数收入信誉归类:买计算机?64高良不买64高优不买128中良不买是否树叶6.2决策树分类算法决策树的建立--决策树建立步骤(例)计数收入学生信誉归类:买计算机?60中否良买64低是良买64低是优不买132中是良买63中否优不买1中否优买年龄青中老买学生是否买不买6.2决策树分类算法决策树的建立--决策树建立步骤(例)老年组数据表分析:1.假定选择收入作节点I(257,127)=0.9157I(64,64)=1比例:128/384=0.3333I(193,63)=0.8050比例:256/384=0.6667平均信息期望(加权总和):E(收入)=0.3333*1+0.6667*0.8050=0.8700Gain(收入)=I(257,127)-E(收入)=0.9157–0.8700=0.0457计数收入学生信誉归类:买计算机?60中否良买64低是良买64低是优不买132中是良买63中否优不买1中否优买计数收入学生信誉归类:买计算机?64低是良买64低是优不买计数收入学生信誉归类:买计算机?60中否良买132中是良买63中否优不买1中否优买6.2决策树分类算法决策树的建立--决策树建立步骤(例)老年组数据表分析:2.假定选择学生作节点I(257,127)=0.9157I(196,64)=0.8051比例:260/384=0.6771I(61,63)=0.9998比例:124/384=0.3229平均信息期望(加权总和):E(学生)=0.6771*0.8051+0.3229*0.9998=0.8680Gain(学生)=I(257,127)-E(学生)=0.9157–0.8680=0.0477计数收入学生信誉归类:买计算机?60中否良买64低是良买64低是优不买132中是良买63中否优不买1中否优买计数收入学生信誉归类:买计算机?64低是良买64低是优不买132中是良买计数收入学生信誉归类:买计算机?60中否良买63中否优不买1中否优买6.2决策树分类算法决策树的建立--决策树建立步骤(例)老年组数据表分析:3.假定选择信誉作节点I(257,127)=0.9157I(256,0)=0比例:256/384=0.6667I(1,127)=0.0659比例:128/384=0.3333平均信息期望(加权总和):E(信誉)=0.6667*0+0.3333*0.0659=0.0220Gain(信誉)=I(257,127)-E(信誉)=0.9157–0.0220=0.8937结论:决定选择属性信誉计数收入学生信誉归类:买计算机?60中否良买64低是良买64低是优不买132中是良买63中否优不买1中否优买计数收入学生信誉归类:买计算机?60中否良买64低是良买132中是良买计数收入学生信誉归类:买计算机?64低是优不买63中否优不买1中否优买为什么频繁模式挖掘是数据挖掘的基本任务?关联,相关,因果关系序列模式,时间或周期关联,局部周期性,空间和多媒体关联关联分类,聚类分析,冰山方,fascicles(语义数据压缩)许多基本的数据挖掘任务的基础01购物篮数据分析,交叉销售,分类设计,销售活动分析Web日志(点击流)分析,DNA序列分析,等.广泛的应用0201Apriori02关联规则的一个算法03CARMACARMA算法简介CARMA是一种比较新的关联

文档评论(0)

shao12345 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档