网站大量收购闲置独家精品文档,联系QQ:2885784924

数据仓库系统的设计与开发.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据仓库系统的生命开发周期数据仓库系统的开发与设计是一个动态的反馈和循环过程。一个数据仓库系统包括:数据仓库数据库数据分析应用系统第5页,共32页,星期六,2024年,5月数据仓库系统的生命开发周期第6页,共32页,星期六,2024年,5月建立数据仓库系统的两种思维模式自顶向下(Top-down)将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式存入各个数据集市中。自底向上(Bottom-Up)通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。第7页,共32页,星期六,2024年,5月数据仓库数据库的设计步骤第8页,共32页,星期六,2024年,5月3.2基于SQLServer的数据仓库数据库设计过程详解SQLServer2005介绍集成了三个服务。SQLServer2005的数据仓库架构第9页,共32页,星期六,2024年,5月MSSQLServer2005的数据仓库架构第10页,共32页,星期六,2024年,5月3.2基于SQLServer的数据仓库数据库设计过程详解包括以下步骤:分析组织的业务状况及数据源结构组织需求调研,收集业务需求采用信息包图法进行数据仓库的概念模型设计利用星形图进行数据仓库的逻辑模型设计数据仓库的物理模型设计第11页,共32页,星期六,2024年,5月分析组织的业务状况及数据源结构以SQLServer2005实例数据库AdventureWorksDW中所描述AdventureWorksCycles公司的用户需求为例。公司概况业务系统流程介绍对数据源结构的分析与理解第12页,共32页,星期六,2024年,5月组织需求调研,收集业务需求坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用户的需求,进而对需求进行分析。关于用户需求的调研(确定主题域)对用户需求调研结果的分析(确定度量指标和维度)第13页,共32页,星期六,2024年,5月物理模型星型、雪花模型物理数据模型概念模型逻辑模型面向用户的需求细化层次更详细的技术细节信息包图采用信息包图法进行概念模型设计第14页,共32页,星期六,2024年,5月信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。信息包图法简介第15页,共32页,星期六,2024年,5月工作:确定系统边界:决策类型、需要的信息、原始信息确定主题域及其内容:主题域的公共键码、联系、属性组确定维度:如时间维、销售位置维、产品维、组别维等确定类别:相应维的详细类别确定指标和事实:用于进行分析的数值化信息第16页,共32页,星期六,2024年,5月信息包图的建立信息包: 维度类别 空白信息包图样式指标和事实第17页,共32页,星期六,2024年,5月〖例〗试画出销售分析的信息包图。解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实:(1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。(2)类别:确定各维的详细类别,如:日期维包括年(5)、季度(20)、月(60)、日(1800),括号中的数字分别指出各类别的数量;区域维包括国家(10)、省州(100)、城市(500)、销售点(8000),括号中的数字同样分别指出各类别的数量;类似地,可以确定产品维、客户维、广告维等的详细类别。(3)指标和事实:确定用于进行分析的数值化信息,包括实际销售额、计划销售额和计划完成率。第18页,共32页,星期六,2024年,5月销售分析的信息包图日期维区域维产品维客户维广告维(待用)年度(5)国家(10)产品类别(500)年龄分组(7)广告费分组(2)季度(20)省州(100)产品名称(9000)收入分组(8)月(60)城市(500)信用组(2)日(1800)销售点(8000)指标和事实:实际销售额、计划销售额、计划完成率信息包:销售分析 维度类别第19页,共32页,星期六,2024年,5月设计基于主题域的概念模型供应商ID相关信息有关信息商品信息供应商供应商主题顾客顾客ID顾客主题商品商品ID商品主题第20

文档评论(0)

xiaozhuo2022 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档