- 1、本文档共177页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自动化前沿;主要内容 ;一、数据挖掘概述;数据挖掘概念;数据挖掘与KDD;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的社会需求;数据挖掘的发展;数据挖掘技术;异常检测;什么是异常(outlier)?;异常检测方法的分类;数据挖掘系统的特征;数据的特征;系统的特征;知识(模式)的特征;知识表示:规则;知识表示:分类树;数据挖掘算法的特征;数据挖掘的主要方法;数据挖掘系统;数据挖掘系统;数据挖掘系统;二、数据预处理;为什么需要预处理;污染数据形成的原因;数据清理的重要性;数据清理处理内容;数据规约;空缺值;噪声数据;分箱;聚类;回归;数据集成;数据变换;最小 最大规范化
小数定标规范化
属性构造
由给定的属性构造和添加新的属性,以帮助提高精度和对高维数据结构的理解
;数据立方体聚集;维规约;数据压缩;数值规约;数值规约 ;离散化和概念分层;数值数据离散化;分类数据的概念分层生成;三、数据挖掘算法-分类与预测;分类 VS. 预测;数据分类:两步过程;第一步:建立模型;第二步:用模型进行分类;准备分类和预测的数据;比较分类方法;用判定树归纳分类;判定归纳树算法;贝叶斯分类;后向传播分类;其他分类方法;什么是预测?;回归方法;评估分类法的准确性;提高分类法的准确性;四、数据挖掘算法-聚类;聚类分析;什么是聚类分析?;聚类的常规应用 ;应用聚类分析的例子;聚类方法性能评价;聚类方法性能评价;两种数据结构;评价聚类质量;聚类分析中的数据类型;区间标度变量;计算对象之间的相异度;计算对象之间的相异度;序数型变量;序数型变量;比例标度型变量;混合类型的变量;混合类型的变量;主要聚类方法;五、数据挖掘算法-关联;什么是关联挖掘?;关联规则:基本概念;规则度量:支持度与可信度;关联规则挖掘:路线图;关联规则挖掘—一个例子;关键步骤:挖掘频繁集;多层关联规则;挖掘多层关联规则;多层关联规则;支持度不变;支持度递减;多层关联:冗余过滤;多层挖掘:深度优先;数据挖掘查询的逐步精化;逐步求精空间关联规则挖掘;逐步求精空间关联规则挖掘;多维关联规则:概念;挖掘多维关联的技术;数值属性的静态离散化;带数量的关联规则;ARCS (关??规则聚集系统);ARCS的局限性;基于距离的关联规则挖掘;记S[X] 为 N 个元组 t1, t2, …, tN 在 属性集 X 上的投影
则 S[X] 的直径:
distx:距离量度,如 欧几里德距离或 Manhattan
;用直径 d 评估聚集 CX 的密度,其中
查找聚集和基于距离的规则
用密度阈值 d0代替支持度
采用修改过的 BIRCH 聚集算法
;关联规则可视化Using Plane Graph;关联规则可视化Using Rule Graph;六、序列模式挖掘;序列模式概念;序列模式实例;序列模式应用领域;序列模式表示;序列模式表示;序列模式表示;序列模式挖掘;序列模式挖掘算法;序列模式挖掘算法;七、数据挖掘软件;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;二、数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;二、数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的发展;数据挖掘软件的现状;数据挖掘软件的现状;八、数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘应用;数据挖掘未来发展;数据挖掘应用——时间序列模式挖掘;工业过程变量时间序列;批量型生产过程;连续型生产过程;数据挖掘对象的基本构成;样本的抽取(批量生产过程);连续生产过程的样本抽取;如何“组装”时间序列?;关于生产质量改变的模式假设;时间序列的模式抽取;时间序列的模式抽取;时间序列的模式抽取;常见的有物理意义的特征模式;数据挖掘的两种应用方式;质量分类模型的挖掘;质量分析结论的挖掘;一个示例:加热炉生产质量数据挖掘;一个示例:加热炉生产质量数据挖掘;一个示例:加热炉生产质量数据挖掘;一个示例:加热炉生产质量数据挖掘;一个示例:加热炉生产质量数据挖掘;
文档评论(0)