《数据挖掘》课件 第3章 分类.pdfVIP

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘 高级大数据人才培养丛书之一,大数据挖掘技术与应用 第三章分类 分类是一种很重要的数据挖掘技术,也是数据挖掘研究的重点和热点之一。分类的目 的是分析输入数据,通过训练集中的数据表现出来的特性,为每一个类找到一种准确描 述或者模型,这种描述常常用谓词来表示。由此 成的类描述用来对未来的测试数据进 行分类。尽管这些未来测试数据的类标签是未知的,仍可以由此预测这些新数据所属的 类。也可以由此对数据中每一个类有更好的理解。 高级大数据人才培养丛书之一,大数据挖掘技术与应用 第三章分类 .3.1 基本概念 3 :2决策树 3.3 贝叶斯分类 3.4 支持向量机 3.5 实战:决策树算法在Weka中的实现 习题 ,3.1基本概念 第三章分类 3.1.1分类的基本概念 分类(Classification )是一种重要的数据分析形式,它提取刻画重要数据类的模型。 这种模型称为分类器,预测分类的(离散的、无序的)类标号。这些类别可以用离散值 表示,其中值之间的次序没有意义。 分类也可定义为: 分类的任务就是通过学习得到一个目标函数(Target Function);,把每个属性集x映 射到一个预先定义的类标号y o 图行天下 Ko. 20150104020018208171 )3.1基本概念 第三章分类 3.1.2分类的过程 数据分类过程有两阶段: (1)学习阶段(构建分类模型)。 (2)分类阶段(使用模型预测给定数据的类标号 )o 训练集 I Tid 属性1 属性2 属性3 类 1 Yes Large 125K No 2 No Medium 100K No 3 No Small 70K No 4 Yes Medium 120K No 5 No Large 95K Yes 6 No Medium 60K No 7 Yes Large 220K No 8 No Small 85K Yes 9 No Medium 75K No 10 No Small 90K Yes 测试集 I Tid 属性1 属性2 属性3 类 11 No Small 55K ? 12 Yes Medium 80K ? 13 Yes Large 110K ? 14 No Small

文档评论(0)

xf118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档