数据仓库与决策支持系统培训课件.pptxVIP

数据仓库与决策支持系统培训课件.pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与决策支持系统 一、数据仓库 数据仓库:面向主题的、集成的、稳定的、随时间变化的数据集合 面向主题指数据仓库的建立有一个主体的对象,而非单一的事务 集成表示数据仓库是将围绕该主题的各类数据集成在一起而形成 稳定意味着不可更新 随时间变化指对应不同时间点,有不同批次的数据 一、数据仓库 数据仓库VS数据库 比较内容 数据仓库 数据库 目标 Online Analytical Processing Online Transaction Processing 作用 面向主题 面向过程 活动 分析 事务处理 构成 集成 分散 内容 不可更改 可更改 系统需求 事先可以不知道 事先已知 数据量 一次操作数据量大 一次操作数据量小 时间性 时序性 当前 基础结构 多维型 关系型 关系结构 星型、雪花 3NF 终端用户 管理者、决策者 事务操作人员 一、数据仓库 分析型处理VS事务型处理 比较内容 分析型处理 事务型处理 性能特性 运行时间较长、消耗大量系统资源 数据存取频率高、处理时间短 数据集成问题 需要大量的、集成的数据作为分析基础 大多数应用数据是分散的、不一致的 动态集成 需要集成数据的周期性更新 仅在开始阶段对数据进行静态集成 历史数据问题 许多分析方法要以大量的历史数据为依据 一般只需要当前或短期数据 数据综合问题 主要关注综合性数据 积累了大量的细节数据 一、数据仓库 数据仓库体系结构 一、数据仓库 元数据(Metadata):关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们 所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。   技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:   数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;   业务系统、数据仓库和数据集市的体系结构和模式;   汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;   由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。    一、数据仓库 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的 数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报 表的信息;具体包括以下信息:   企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。以这个企业模型为基础,不懂数据库技术和SQL语句的业务人员对数据仓库中的数据也能做到心中有数。   多维数据模型:这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。这里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。 一、数据仓库 元数据的作用 在数据仓库系统中,元数据机制主要支持以下五类系统管理功能: 描述哪些数据在数据仓库中; 定义要进入数据仓库中的数据和从数据仓库中产生 的数据; 记录根据业务事件发生而随之进行的数据抽取工作时间安排; 记录并检测系统数据一致性的要求和执行情况; 衡量数据质量。   二、数据仓库在决策支持系统中的应用   二、数据仓库在决策支持系统中的应用  决策支持系统中的模型库可以为决策者提供推理、比较、选择和分析的工具。模型库中一般包含两类模型: 数学模型 图形与报表模型 由上述两者可以集成为规划模型、推理模型、分析模型、预测模型、优化模型与评价模型 而这些模型的建立、仿真与训练都需要大量的数据来解析与验证。 二、数据仓库在决策支持系统中的应用 决策支持系统中使用的大量数据通常为多维数据,需要利用切片,切块,钻取等操作从多个角度进行观察,并把结果用直观的表格或图形展现出来,以支持决策。 故需要引入数据挖掘的相关算法(之一) ——关联规则 三、关联规则 关联规则是数据一种简单实用的规则,而关联规则挖掘就是从大量的数据中挖掘出有价值的描述数据项之间相互联系的信息 以下是关联规则相关的一些概念 关联规则:设I={I1,I2,I3…,Im}为数据项集合;设D为与任务相关的数据集合,也就是一个交易数据库;其中每个交易T是一个数据项子集,即T包含于I;每个交易均包含一个

文档评论(0)

认证主体菲亚企业管理咨询服务(天津自贸试验区)有限公司
IP属地天津
统一社会信用代码/组织机构代码
91120118MA05M78NXX

1亿VIP精品文档

相关文档