- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树算法培训解读
决策树介绍;什么是决策树?;什么是决策树?;叶结点;决策树构造流程;决策树的背景是什么?; 在影视领域,大数据运用的成功案例当数美剧《纸牌屋》。该剧的制作方既不是电视台,也不是传统的电影公司,而是一家视频播放网站。2012年,视频网站Netflix开始准备推出自制剧。在决定拍什么、怎么拍时,Netflix抛开了传统的制作方式,启用大数据。通过在该网站上3000多万订阅用户每天的点击操作,如收藏、推荐、回放、暂停、有哪些信誉好的足球投注网站请求等,Netflix进行精准分析,将这些数据用于倒推前台的影片生产。;大数据的到来使得数据挖掘技术得到广泛发展;决策树的起源是CLS(Concept Learning System),CLS是由Hunt、Marin和Stone为了研究人类概念模型而得来的,于1966年提出,该模型为很多决策树算法的发展奠定了很好的基础。; 熵;信息增益的算法;ID3算法;ID3算法实例;;ID3算法缺点;C4.5算法;2) 处理含有带??失值属性的样本;4) 规则的产生;CART(Classification And Regression Tree);CART算法;CART实例;CART实例;决策树的剪枝;后剪枝方法;R实现;决策树可以做什么?;总结;2、决策树有很多种算法,有没有一种算法能够优于其他所有算法?;classification and regression tree(CRT) (对二元分类比较有效)
可自动忽略对目标变量没有贡献的属性变量,也为判断属性变量的重要性,
减少变量数据提供参考;
2) 在面对诸如存在缺失值、变量数多等问题时CRT 显得非常稳健(robust);
3) 估计模型通常不用花费很长的训练时间;
4) 比其他模型更易于理解——从模型中得到的规则能得到非常直观的解释,
决策推理过程可以表示成IF…THEN的形式;
5) 目标是定类变量为分类树,若目标变量是定距变量,则为回归树;
6) 通过检测输入字段,通过度量各个划分产生的异质性的减小程度,找到最佳的
一个划分;
7) 非常灵活,可以允许有部分错分成本,还可指定先验概率分布,可使用自动的
成本复杂性剪枝来得到归纳性更强的树。
;3、决策树的发展方向如何? ;3) 数据集的预处理;Thank you!
文档评论(0)