企业大数据平台仓库架构建设思路.pdf

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业大数据平台仓库架构建设思路

企业大数据平台下数仓架构 阿里云-飞天一部 介然 总体思路 模型设计 数加架构 数据治理 新环境下的数据应用特征 业务变化快 数据来源多 系统耦合多 应用深度深 关键词 稳定 可信 丰富 透明 大数据平台特征 强大的计算和存储能力; 多样的编程接口和框架; 丰富的数据采集通道; 各种安全和管理措施; 仓库架构设计原则 自下而上+自上而下; 高容错性; 数据质量监控贯穿整个数据流程; 不怕数据冗余,利用存储换易用; 总体思路 模型设计 数加架构 数据治理 维度建模 OR 实体关系建模  维度建模  实体关系建模  实施简单  实施复杂  便于事实数据分  便于主体数据打 析 通  适合业务分析报  适合复杂数据内 表和BI 容的深度挖掘 星型模型 AND 雪花模型 两种模型是并存的 星型是雪花的一种,理论上真实数据的 模型都为雪花模型,实际数据仓库中两 种模型会并存。 中间层将雪花转变成星型 星型模型相对结构简单,在数据中间层 利用数据冗余将雪花转变成星型模型有 利于数据应用和减少计算资源消耗。 数据分层 上下三层结构 集市层 减少层次结构的目的是为了压缩整体数 用 据处理流程的长度,扁平化的数据处理 流程有助于数据质量控制和数据运维 流式 中间层 流式数据作为数据体系的一部分 通 数据 当前的数据应用方向会越来越关注数据 的时效性,越实时的数据价值度越高。 基础数据层 存 基础数据层 数据清洗

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档