- 1、本文档共177页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘技术及其应用要点
* * * * * * 数据挖掘应用 异常检测 及时发现有欺诈嫌疑的异常行为,正确进行欺诈问题的评估,对欺诈者实施控制和强制措施。 技术:决策树,神经元网络,异常因子LOF检测 客户消费异常行为分析模型 数据挖掘应用 客户分析业务模型 交叉销售 客户响应 客户流失 客户利润 信用卡分析业务模型 客户信用等级评估 客户透支分析 客户利润分析 客户消费行为分析 客户消费异常行为分析 数据挖掘应用 MIS ERP CRM E_Business CDW 客户数据仓库 数据挖掘 算法库 模型库 组件库 产品推荐 客户细分 客户流失 客户利润 客户响应 … 行业应用 知识 CIAS应用服务器 信息系统 行业分析 数据挖掘应用平台CIAS 数据挖掘应用 客户响应模型—基本概念 响应率分析: 分析客户对某种新服务或者新产品的感兴趣情况. 为什么要进行响应率分析: 通过响应率分析能够有效的降低市场推广的费用,同时能够更加有针对性的面对目标市场.达到以最小的投入获得最佳效果的目的 数据挖掘应用 用哪一种数据挖掘技术实现? 响应率分析是为了对某项市场营销(新产品销售)活动找到最合适的响应客户,需要预测哪些客户能够响应,以及响应的可能性是多少。 因此,需要构建预言模型 分类是预言模型的一种技术,可以利用分类技术构建客户响应率模型 决策树 神经网络 贝叶斯分类 … 数据挖掘未来发展 与数据库数据仓库系统集成 与预言模型系统集成 挖掘各种复杂类型的数据 与应用相结合 研制和开发数据挖掘标准 支持移动环境 数据挖掘应用——时间序列模式挖掘 工业过程变量时间序列 生产过程的类型 连续过程:工艺参数(设定值)均为常量。 批量过程:工艺参数(设定值)通常为变量。 工艺参数的数据类型 数值型、逻辑型、枚举型 产品质量的数据类型 逻辑型:只判断产品的好坏 数值型:给出产品质量好坏的程度 生产过程 工艺参数 1 (连续型时间序列) 工艺参数 2 (离散型时间序列) 产品质量 (离散型时间序列) 批量型生产过程 质量检验! t 0 t1 t2 t3 T 预热阶段 加热阶段 均热阶段 T 连续型生产过程 T1 T2 T3 v x1 x2 x3 质量检验! 0 x 预热区 加热区 均热区 t 0 t1 t2 t3 质量检验! T T1 T3 T2 数据挖掘对象的基本构成 生产过程 X:工艺参数时间序列 Y:质量检测结果 t X t Y 样本的抽取(批量生产过程) t t x1(t) y1 y2 y3 x2(t) x3(t) X Y 样本1 样本2 样本3 …… 连续生产过程的样本抽取 连续过程 ? 批量过程 T1 T2 T3 v x1 x2 x3 t T3 T2 T1 0 质量检验! 0 T1 T2 T3 T t t1=x1 / v t2=x2 / v t3=x3 / v 0 质量检验! t1 t2 t3 如何“组装”时间序列? T1 T3 T2 质量检验! t T3 T2 T1 0 t1 t2 t3 质量检验! T 组装前 t 0 t1 t2 t3 T 组装后 样本 关于生产质量改变的模式假设 生产质量不良的原因是工艺参数设计或控制有问题: 设计阶段:工艺参数设计有错误; 控制阶段:工艺参数未能控制在设计值; 上述因素都可通过生产过程中工艺参数的时间序列实测样本反映出来。 工艺参数的时间序列中某些特征的改变,引起生产质量从量变到质变。 时间序列的特征,可以用模式来描述。 时间序列的模式改变,是生产质量不良的原因。 数据挖掘的目的,就是要寻找引起生产质量不良的工艺参数模式。 时间序列的模式抽取 目的: 将时间序列样本集合转换为特征模式样本集合,每一种模式(或若干种模式的一种组合)用一个整数来编码,从而将数据挖掘的对象从时间序列空间转换为整数空间。 其中,mi 为 xi (t) 所包含的特征模式的集合。注意: mi 不再是时间序列 mi 可能是多元素的集合,即 xi(t) 可包含多种模式 模式抽取 时间序列的模式抽取 时间序列分析理论中已给出一类模式抽取的方法:根据时间序列建立 ARMA模型。 或理解为把时间序列空间映射到 ARMA模型中的参数空间,也称为时间序列的 ARMA特征空间。 这一方法的优点是: 成熟 有严密的数学基础 缺点是: ARMA特征没有物理意义,难以据其改进产品质量。 时间序列的模式抽取 (有物理意义的)模式抽取问题: 给定(有物理意义的)模式集合,寻找时间序列中存在的模式种类。 给定模式集合的方法: 有先验知识 —— 根据先验知识构造与产品质量有关的模式类 没有先验知识 —— 穷举构造所有可能的有物理意义的模式 只有部分先验知识 —— 上述两种方法的组合 寻找时间序列中模式的方法: 给出模式的特征 给出计算特征匹配
文档评论(0)