基本概念、决策树与模型评价.pptx

  1. 1、本文档共92页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘 分类:基本概念、决策树与模型评价; 分类的是利用一个分类函数(分类模型、分类器),该模型能把数据库中的数据影射到给定类别中的一个。 ;分类;;数据分类——一个两步过程 (1);数据分类——一个两步过程 (2);有监督的学习 VS. 无监督的学习;分类模型的构造方法;一个决策树的例子;决策树的另一个例子;用决策树归纳分类; 为了对未知数据对象进行分类识别,可以根据决策树的结构对数据集中的属性进行测试,从决策树的根节点到叶节点的一条路径就形成了相应对象的类别测试。决策树可以很容易转换为分类规则 ;决策树分类任务;一个决策树的例子;应用决策树进行分类;应用决策树进行分类;应用决策树进行分类;应用决策树进行分类;应用决策树进行分类;应用决策树进行分类;决策树分类;决策树;Hunt 算法;Hunt算法;决策树;决策树;怎样为不同类型的属性指定测试条件?;基于标称属性的分裂;多路划分: 划分数(输出数)取决于该属性不同属性值的个数. 二元划分: 划分数为2,需要保持序数属性值的有序性. ;基于连续属性的划分;基于连续属性的划分;决策树;怎样选择最佳划分?;怎样选择最佳划分?;怎样找到最佳划分?;结点不纯性的测量;不纯性的测量: GINI;计算 GINI的例子;基于 GINI的划分;二元属性: 计算 GINI;标称属性:计算Gini;连续属性: 计算 Gini;连续属性: 计算 Gini...; ;熵---定义;;基于 Information Gain的划分;计算 Entropy的例子;基于 Information Gain的划分...;基于 Information Gain的划分...;基于 Classification Error的划分;例子;不纯性度量之间的比较;决策树;停止分裂过程;;三种著名的决策树;决策树;子树重复问题;决策边界;斜决策树;模型过分拟合和拟合不足;模型过分拟合和拟合不足;模型模型过分拟合和拟合不足;导致过分拟合的原因;导致过分拟合的原因;噪声导致的过分拟合(例子);缺乏代表性样本导致的过分拟合;;;过分拟合与多重比较;;泛化误差估计;;结合模型复杂度;悲观误差评估;;;最小描述长度 (MDL);使用确认集;处理决策树中的过分拟合;处理决策树中的过分拟合…;处理决策树中的过分拟合…;不平衡类问题;准确率的缺点;度量;;ROC (Receiver Operating Characteristic);使用ROC曲线比较模型;怎样产生ROC曲线;9、有时候读书是一种巧妙地避开思考的方法。8月-218月-21Monday, August 2, 2021 10、阅读一切好书如同和过去最杰出的人谈话。17:11:3017:11:3017:118/2/2021 5:11:30 PM 11、越是没有本领的就越加自命不凡。8月-2117:11:3017:11Aug-2102-Aug-21 12、越是无能的人,越喜欢挑剔别人的错儿。17:11:3017:11:3017:11Monday, August 2, 2021 13、知人者智,自知者明。胜人者有力,自胜者强。8月-218月-2117:11:3017:11:30August 2, 2021 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。02 八月 20215:11:30 下午17:11:308月-21 15、最具挑战性的挑战莫过于提升自我。。八月 215:11 下午8月-2117:11August 2, 2021 16、业余生活要有意义,不要越轨。2021/8/2 17:11:3017:11:3002 August 2021 17、一个人即使已登上顶峰,也仍要自强不息。5:11:30 下午5:11 下午17:11:308月-21

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档