第3单元 数据挖掘简介--补充.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3单元 数据挖掘简介--补充

1 第二章:数据仓库及OLAP技术 数据仓库的概念? 多维数据模型 数据仓库的系统结构 数据仓库实现 数据方技术的进一步发展 从数据仓库到数据挖掘 2 第二章:数据仓库及OLAP技术 数据仓库的概念 多维数据模型 数据仓库的系统结构 数据仓库实现 数据方技术的进一步发展 从数据仓库到数据挖掘 3 由表和电子数据表到数据立方体 数据仓库和OLAP建立在多维数据模型上,多维数据模型把数据看成数 据方的形式。 “什么是数据方?” 数据方允许以多维对数据建模和观察。它由维和事实定义。 维是透视或关于一个组织想要记录的实体。 每一个维都有一个表与之相关联。该表称为维表,它进一步描述维。 维表可以由用户或专家设定,或者根据数据分布自动产生和调整。 多维数据模型围绕中心主题(例如,sales)组织。该主题用事实表表示。 事实是数值度量的。 事实表包括事实的名称或度量,以及每个相关维表的关键字。 4 由表和电子数据表到数据立方体 在数据仓库中,数据方是n-D的。 表2.2:AllElectronics的销售数据按照维time,item的2-D视图。 其中销售是取自location=“Vancouver”的所有分店,所显示的度量是dollars_sold 5 由表和电子数据表到数据立方体 表2.3 Allelectronics销售数据的3-D视图 根据time,item,和location,所显示的度量是dollars_sold(单位:$1000) 6 由表和电子数据表到数据立方体 图2.1:表2.3数据的3-D数据方表示 维是time,item和location,所显示的度量为dollars_sold(单位:$1000) 13 由表和电子数据表到数据立方体 图2.2销售数据的4-D数据方表示 维是和time,item,location和supplier,所显示的度量为dollars_sold(单位:$1000) 7 8 由表和电子数据表到数据立方体 任意n-D数据方可以显示成(n-1)-D数据方的序列。 数据方是对多维数据存储的一种比喻,这种数据的实际物理存储不同于 它的逻辑表示。 数据方是n维的,而不限于3-D。 数据仓库研究界,每个数据方称作一个方体。 方体的格称作数据方。 9 由表和电子数据表到数据立方体 all time item location supplier time,item time,location time,supplier item,location item,supplier location,supplier time,item,location time,item,supplier time,location,supplier item,location,supplier 1-D 方体 2-D 方体 0-D(顶点)方体 3-D 方体 4-D(基本) 方体 time, item, location, supplier 图2.3方体格,形成维time,item,location和supplierr的4-D数据方。 每个方体代表一个不同的汇总 10 多维数据库模式 建立数据仓库模型:维与事实 星型模型: 中间是事实表,联机一组维表 雪花模式: 雪花模式是星型模式的变种,其中某 些维表示规范化的,而数据进一步分解到附加 的维表中,它的图形类似于雪花的形状 星座模式: 多个事实表共享维表,这种模式可 以看作星型模式集,因此称为星系模式或星座模式 11 星型模式的例子 图2.4:Sales数据仓库的星形模式 在星形模式中,每维只用一个表表示,每个表包含一组属性。 12 雪花模式的例子 图2.5 sales数据仓库的雪花模式 13 星座模式 图2.6 sales和shipping数据仓库的星座模式 14 多维数据库模式 在数据仓库中,数据仓库和数据集市是有区别的。 数据仓库收集了关于整个组织的主题(如顾客、商品、销售、资产和人员)信息,因此是企业范围的。 对于数据仓库,通常使用星座模式,因为它能对多个相关的主题建模。 数据集市是数据仓库的一个部门子集,它针对选定的主题,因此是部门范围的。 对于数据集市,流行星型或雪花模式,

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档