[高级DB-第8章数据挖掘SUM.ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[高级DB-第8章数据挖掘SUM

第八章 数据仓库与挖掘 数据仓库的定义和特点 创始人W.H.Inmon对数据仓库的定义: 数据仓库就是面向主题的、集成的、 非易失的(稳定)、随时间变化的 数据集合,用以支持经营管理中的 决策制定过程。 数据仓库的定义和特点 数据仓库的组成 数据仓库的体系结构 数据仓库的模式 有多种:星型模式、雪花模式、星座模式、暴风雪模式等。 OLAP 概述 1.OLAP:对特定问题的联机数据访问和分析。 可对转换的信息进行快速、稳定一致和交互性的存取,对大量的多维数据进行动态地合并和分析。 OLAP的基本操作 钻取:在一个维内部沿着层次从上到下或从下到上的方向考察数据 上钻(Drill up) 下钻(Drill down) 切片/切块(Slice and dice) 固定某些维成员,对其它维进行考察 旋转(Pivot,rotate) 按不同顺序组织各个维,对结果进行考察 OLAP的基本操作 一个OLAP操作实例: OLAP的基本操作 切片 OLAP的基本操作 旋转:按不同顺序组织各个维,对结果进行考察 OLAP的实现方法 2.OLAP服务器的实现方法 关系OLAP 多维OLAP 混合OLAP OLAP的实现方法 关系OLAP服务器方式 OLAP的实现方法 多维OLAP服务器方式 OLAP的实现方法 混合OLAP服务器方式 数据挖掘概述 1.为什么需要数据挖掘? 数据挖掘概述 3.数据挖掘是多学科的交叉 数据挖掘流程 1)数据准备:选择数据;数据预处理(包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等)。 2)定义问题:清晰地定义出业务问题,确定数据挖掘的目的及需获取的目标数据集。 3)数据挖掘: 根据数据功能的类型和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。 4)结果分析: 对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。 5)知识的运用: 将分析所得到的知识集成到业务信息系统的组织结构中去。 数据挖掘的步骤 3个主要工作: 数据准备、挖掘操作、结果表达和解释 数据挖掘的常用方法 1)神经网络。以生物神经系统的神经细胞的数学模型为基础来描述的,它由网络拓扑,节点特点和学习规则来表示。 2)遗传算法。是一种基于生物自然选择与遗传机理的随机有哪些信誉好的足球投注网站算法,是一种仿生全局优化方法。 3)决策树方法。是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。 4)粗集方法。粗集理论是一种研究不精确、不确定知识的数学工具。粗集处理的对象是类似二维关系表的信息表。 6)统计分析方法。利用统计学原理对数据库中的信息进行分析。可进行数据总和、求平均值、回归、相关、差异分析等。 7)模糊集方法。利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。 第八章 数据仓库与挖掘 主 要 内 容: 数据仓库的特点是 --面向主题、集成、非易失和随时间变化。 联机分析处理(OLAP)的特点和基本操作 基本操作:上钻、下钻 、切片 、切块和旋转 OLAP的实现方式: 关系OLAP、 多维OLAP、混合OLAP 数据挖掘的概念及与流程 高级数据库技术 第1章 高级数据库技术导论 第2章 高级SQL技术 第3章 数据库系统建模方法 第4章 数据库系统调优技术 归纳:DBS包括: 数据模型 关系数据语言 第1章 高级数据库技术导论 本章要点: DB、DBMS、DBS及其关系 几种数据模型的特征 DB技术的研究与发展 第二章 高级SQL技术 1. SQL 高级查询 2. 安全与完整性设计 3. 过程化SQL 第三章 数据库系统建模方法 1. 扩展E-R图的表示、设计与转换 2. UML的E-R建模方法 第四章 数据库系统调优技术 主要内容: 1. 关系DB的查询优化 优化方法 第五章 基于对象的数据库 主要内容: 面向对象数据模型的基本概念 对象定义语言(ODL)和对象查询语言(OQL) 对象数据模型的应用 对象关系数据模型 对象关系数据类型扩展 对象关系DB的继承、引用、查询等操作 思考: 面向对象模型中的对象和E-R模型中的实体有何区别? 例: 1、将E-R图转为尽可能少的关系模式。 将E-R图用UML图表示。 课堂练习: 2.设R(学号,姓名,课程,成绩,……), SQL语句表示:求数学成绩比王红高的学生名? 列出几种提高该查询效率的途径. 类型继承与引用例: Create type depart ( id INT, manager REF(Staff ) addr varchar (20)

文档评论(0)

xuetingting + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档