第二章数据仓库和数据挖掘的OLAP技术.pptx

第二章数据仓库和数据挖掘的OLAP技术.pptx

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第2章 数据仓库和数据挖掘

的OLAP技术;什么是数据仓库;2、数据处理分为两大类;3、事务处理环境不适宜DSS应

用的原因;

DW的主要驱动力是市场竞争要求捕获和分析事务的业务数据,必须把分析型数据从事务处理环境中提取出来;

DW是为了建立这种新的分析处理环境而出现的一种数据存储和组织技术。;

“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程”—W.H.Inmon

什么是建立数据仓库

我们把建立数据仓库看作是构造和使用数

据仓库的过程;数据仓库的面向主题性;数据仓库的集成性;数据仓库的时变性;数据仓库是非易失的;怎样建立数据仓库;实现DW要做:;DW中的数据组织;;;数据仓库主要用于集中存放用户需要分析的历史数据;数据仓库的特征;数据仓库中的数据分类;数据仓库的主要组成部分;数据仓库的主要特点;什么是OLAP;OLTP与OLAP的关系级比较;OLAP产品的十二条评价准则;OLAP的三层客户/服务器;基于多维数据库的OLAP实现;基于RDB的OLAP实现;数据仓库和异种DBMS数据集成的区别;OLTP系统和OLAP系统的比较;为什么需要一个分离的数据仓库?;第2章 数据仓库和数据挖掘的OLAP技术;由表和电子数据表到数据立方体;数据立方体:方体的格;数据仓库的概念建模;星型模式的例子;雪花模式的例子;事实星座的度量;数据挖掘查询语言DMQL;用DMQL定义星型模式;用DMQL定义雪花模式;用DMQL定义事实星座;度量的分类和计算;代数的:一个聚集函数是代数的,如果它能够由一个具有M个参数的代数函数计算(其中M是一个有界整数),而每个参数都可以用一个分布聚集函数得到

E.g.,avg(),min_N(),standard_deviation().

;整体的:一个聚集函数是整体的,如果描述它的子聚集所需的存储没有一个常数界

E.g.,median(),mode(),rank().

;概念分层;数据仓库概念分层视图;概念分层分类;多维数据模型;数据立方体样本;立方体中不同汇总级相应的方体;数据立方体览图;典型的OLAP操作;转轴(旋转):

转动数据的视角,是一种目视操作,如将3-D立方转换成2-D平面序列

其他OLAP操作

钻过:涉及多个事实表的查询

钻透:钻到数据立方体底层,到达后端关系表(使用SQL机制);星型网查询模型;第2章 数据仓库和数据挖掘的OLAP技术;数据仓库设计:一个商务分析框架;数据仓库设计过程;多层数据仓库体系结构;三类数据仓库模型;数据仓库开发的推荐方法;OLAP服务器类型;第2章 数据仓库和数据挖掘的OLAP技术;数据立方体的有效计算;数据立方体的计算;基于ROLAP的数据立方体

计算方法(1);基于ROLAP的数据立方体计算方法(2);数据立方体计算中的

多路数组聚集(1);数据立方体计算中的

多路数组聚集(2);数据立方体计算中的

多路数组聚集(3);数据立方体计算中的

多路数组聚集(4);索引OLAP数据:位图索引;基本表;索引OLAP数据:连接索引;OLAP查询的有效处理;元数据存储;数据仓库后端工具和实用程序;第2章 数据仓库和数据挖掘的OLAP技术;数据立方体发现驱动的探查;发现驱动数据立方体的例子;多粒度上的复杂聚集:多特征方;第2章 数据仓库和数据挖掘的OLAP技术;数据仓库的使用;从联机分析处理到联机分析挖掘(OLAM);一个集成的OLAM和OLAP结构;广东移动计费数据仓库及在线分析服务;广东移动计费数据仓库;深圳移动2000年7月到2001年3月的移动通话记录以及

费用,总共有约1600,000,000条记录,生成表如下:

;数据仓库建立过程;原始数据;主题确立;数据仓库结构:维,层次,成员和级别;Call_character级别;其他的维:;星型模型;度量;确定计算成员;应用例子:AnalysisServices;下钻(drill-down);多维分析;对2000年7月到2001年三月的通话时长统计。从图中我们能很直观的看到各个时间段(小时为单位)内的通话时长,并可以依次制定时间段话费优惠政策。比如0点至8点完全可以半价优惠或更多;;;;;;;以下话费范围均为2000年7月到2001年3月的单个用户话费总额:

客户群一

161.153923536347=Measures.本地话费=1838.80496474669,

82.1220194285768=Measures.长途话费=2575.4551077738

客户群二

87.5847189603284=Measures.本地话费=899.21982074227,

18603781756622=Measures.

文档评论(0)

hongbing2021 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档