CCCIL_BI_数据仓库设计说明书V1.0.docx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据仓库设计说明书

上海音智达信息技术有限公司

ANALYTICSERVICE

DOCPROPERTYToggleDesignation

PagePAGE4ofNUMPAGES13

DOCPROPERTYTool_ID(Version1.1DOCPROPERTYVersionDOCPROPERTYRelease_Date)

DOCPROPERTYProject_Document_Id

FILENAMECCCIL数据仓库设计说明书.docx

Lastchanged:SAVEDATE\@ddMMMMyyyy23July2012atSAVEDATE\@HH:mm17:40

数据仓库设计说明书(项目一期第四阶段)

可口可乐数据仓库项目

可口可乐企业管理(上海)有限公司

上海音智达信息技术有限公司

文档信息

项目名称:

CCCIL数据仓库项目

项目经理:

Terence

文档版本编号:

1.0

项目阶段:

文档版本日期:

2013-06-28

质量复审方法:

起草人:

Terence

起草日期:

2013-06-28

复审人:

复审日期:

版本记录

版本编号

版本日期

修改者

说明

文件名

1.0

2013-06-28

Terence

文档建立

目 录

TOC\o1-3\h\z\u1. 概述 4

1.1. 编写目的 4

1.2. 术语及其说明 4

2. 数据架构 5

2.1. 操作数据存储(ODS) 5

ODS的特征 5

ODS的数据模型 5

2.2. 企业级数据仓库(EDW) 6

EDW的特征 6

EDW的数据模型 6

2.3. 数据集市(DM) 6

DM的特征 7

DM的数据模型 7

3. 维度和事实 7

3.1. 维度 7

3.2. 度量 9

4. 命名习惯 10

4.1. 一些约定俗成 10

4.2. 表命名习惯 10

4.3. 字段命名习惯 11

5. 逻辑模型 12

5.1. ODS 12

5.2. EDW 12

5.3. DM 13

6. 物理模型 13

6.1. EDW 13

6.2. DM 13

7. 验收 13

概述

编写目的

CCCIL数据仓库项目建设的目标是:借鉴国内外相关行业的建设管理经验、采用BI技术手段,搭建统一的企业级BI平台,为CCCIL各级决策、管理和业务拓展所服务,最终成为公司决策支持的核心管理系统。

本文档将从以下几个方面对数据仓库的设计加以阐述:

数据架构

维度和事实

逻辑模型

物理模型

术语及其说明

数据仓库:是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持经营管理中的决策制定过程。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程,而不是一种可以购买的产品。

数据集市:是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库,或者是更加专业的数据仓库中抽取出来的。数据集市的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据集市的用户希望数据是由他们熟悉的术语表现的。

维度:在多维分析当中用来组织和分析信息的变量、视角,多数情况下维度具有层级关系,用户可以根据这种层级关系对数据进行下钻、上钻等分析。比如时间维度,层级关系有日-月-年。

度量:是在多维分析中对某一事物的特征进行说明的一些可量化的值或变量,如销售金额,销售数量。

聚合:实际业务发生时在业务系统中多记录业务发生的详细信息,明细记录,比如销售明细、库存出入库明细等,但实际分析时希望对这些明细数据加以汇总,数据仓库会对明细记录按照一定的粒度进行聚合生成粒度较粗的记录,这个过程就是聚合。

即席查询:用户根据实际需要从数据仓库中查询信息的一种操作。这种需求通常不是预先就已经设定好的。

ETL:抽取、转换、加载三个英文单词的头字母。他是一种操作,这种操作用来从多个业务系统中抽取业务数据,并按照数据仓库的要求对该数据进行清洗、转换,最后将满足要求的数据加载如数据仓库中。

数据架构

如上图所示,我们将数据仓库划分为三层数据架构,ODS,EDW和DataMart.下面我们详细描述各层的特征和建模原则。

操作数据存储(ODS)

ODS要解决的问题是对业务信息的需求从真实一致性扩展到了快速及时性。

解决的业务需求

支持基于如下条件的决策

从历史的或

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档