数据挖掘模型介绍2016详解.pptx

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘模型介绍2016详解

刘海飞;2;数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术。 3个步骤:数据准备、规律寻找和规律表示。 挖掘任务:关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。 由Daimler Chrysler、SPSS和NCR三家机构共同发展起来的数据挖掘方法论(Http://) CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行业数据挖掘标准流程)注重数据挖掘技术的应用。CRISP-DM过程模型从商业的角度给出对数据挖掘方法的理解。目前数据挖掘系统的研制和开发大都遵循CRISP-DM标准,将典型的挖掘和模型的部署紧密结合。;4;数据挖掘(Data Mining)技术主要无监督和有监督两大类。无监督数据挖掘:不区别对待各个变量,而只是考察变量间的关系。有监督数据挖掘:从数据中获得深度细致的信息,根据一些变量建立模型,来预测另一些变量。 有监督数据挖掘方法:聚类分析、因子分析、主成分分析、神经网络、预测等; 无监督数据挖掘方法: 关联规则挖掘、时序挖掘、偏差分析等。 ;6;Building Tree;决策树进行分类步骤;决策树算法;伪代码(Building Tree);信息增益度度量;训练集(举例);使用信息增益进行属性选择;使用信息增益进行属性选择;使用信息增益进行属性选择;使用信息增益进行属性选择;使用信息增益进行属性选择;使用信息增益进行属性选择;Decision Tree (结果输出);20;21;22;23;24;聚类分析无处不在;聚类分析无处不在;27;聚类分析原理介绍;聚类分析条件;30;31;2聚类分析—举例说明;33;34;35;36;37;38;39;40;41;42;43;44;45;46;47;回归大类:线性回归、多元回归和非线性回归;49;50;51;52;53;54;;;如果 N个样品中的每个样有p个指标x1, x2,…,xp,经过主成分分析,将它们综合成m个综合变量,即;58;59;;已知纽约上市的三只化学产业证券(AC、DP、UC)和两只石油产业证券(EX、TE)100周的收益率调查资料。各证券的收益率依次用X1、X2、X3、X4、X5表示,且样本的平均收益率和相关矩阵R如下,要求对证券收益率做主成分分析和因子分析,并解释其意义。;;主成分分析结果:;因子分析结果(1);;因子分析结果(3);67;68;69;70;71;72;73;74;75;76;77;78

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档