网站大量收购闲置独家精品文档,联系QQ:2885784924

数据挖掘(偶然看到比较好的).pptVIP

  1. 1、本文档共177页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

自动化前沿;主要内容;一、数据挖掘概述;数据挖掘概念;数据挖掘与KDD;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的开展;数据挖掘技术;异常检测;什么是异常〔outlier〕?;异常检测方法的分类;数据挖掘系统的特征;数据的特征;系统的特征;知识〔模式〕的特征;知识表示:规那么;知识表示:分类树;数据挖掘算法的特征;数据挖掘的主要方法;数据挖掘系统;数据挖掘系统;数据挖掘系统;二、数据预处理;为什么需要预处理;污染数据形成的原因;数据清理的重要性;数据清理处理内容;数据规约;空缺值;噪声数据;分箱;聚类;回归;数据集成;数据变换;最小最大标准化

小数定标标准化

属性构造

由给定的属性构造和添加新的属性,以帮助提高精度和对高维数据结构的理解;数据立方体聚集;维规约;数据压缩;数值规约;数值规约 ;离散化和概念分层;数值数据离散化;分类数据的概念分层生成;三、数据挖掘算法

-分类与预测;分类VS.预测;数据分类:两步过程;第一步:建立模型;第二步:用模型进行分类;准备分类和预测的数据;比较分类方法;用判定树归纳分类;判定归纳树算法;贝叶斯分类;后向传播分类;其他分类方法;什么是预测?;回归方法;评估分类法的准确性;提高分类法的准确性;四、数据挖掘算法-聚类;聚类分析;什么是聚类分析?;聚类的常规应用;应用聚类分析的例子;聚类方法性能评价;聚类方法性能评价;两种数据结构;评价聚类质量;聚类分析中的数据类型;区间标度变量;计算对象之间的相异度;计算对象之间的相异度;序数型变量;序数型变量;比例标度型变量;混合类型的变量;混合类型的变量;主要聚类方法;五、数据挖掘算法-关联;什么是关联挖掘?;关联规那么:根本概念;规那么度量:支持度与可信度;关联规那么挖掘:路线图;关联规那么挖掘—一个例子;关键步骤:挖掘频繁集;多层关联规那么;挖掘多层关联规那么;多层关联规那么;支持度不变;支持度递减;多层关联:冗余过滤;多层挖掘:深度优先;数据挖掘查询的逐步精化;逐步求精空间关联规那么挖掘;逐步求精空间关联规那么挖掘;多维关联规那么:概念;挖掘多维关联的技术;数值属性的静态离散化;带数量的关联规那么;ARCS(关联规那么聚集系统);ARCS的局限性;基于距离的关联规那么挖掘;记S[X]为N个元组t1,t2,…,tN在属性集X上的投影

那么S[X]的直径:

distx:距离量度,如欧几里德距离或Manhattan;用直径d评估聚集CX的密度,其中

查找聚集和基于距离的规那么

用密度阈值d0代替支持度

采用修改正的BIRCH聚集算法;关联规那么可视化UsingPlaneGraph;关联规那么可视化UsingRuleGraph;六、序列模式挖掘;序列模式概念;序列模式实例;序列模式应用领域;序列模式表示;序列模式表示;序列模式表示;序列模式挖掘;序列模式挖掘算法;序列模式挖掘算法;七、数据挖掘软件;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;二、数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;二、数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的开展;数据挖掘软件的现状;数据挖掘软件的现状;八、数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘未来开展;数据挖掘应用——

时间序列模式挖掘;工业过程变量时间序列;批量型生产过程;连续型生产过程;数据挖掘对象的根本构成;样本的抽取〔批量生产过程〕;连续生产过程的样本抽取;如何“组装”时间序列?;关于生产质量改变的模式假设;时间序列的模式抽取;时间序列的模式抽取;时间序列的模式抽取;常见的有物理意义的特征模式;数据挖掘的两种应用方式;质量分类模型的挖掘;质量分析结论的挖掘;一个例如:加热炉生产质量数据挖掘;一个例如:加热炉生产质量数据挖掘;一个例如:加热炉生产质量数据挖掘;一个例如:加热炉生产质量数据挖掘;一个例如:加热炉生产质量数据挖掘;

文档评论(0)

liuzhouzhong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档