数据仓库模型的设计说明.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.5数据仓库模型的设计数据仓库模型的设计大体上可以分为以下三个层 面的设计151:.概念模型设计; ?逻辑模型设计; ?物理模型设计;下面就从这三个层面分别介绍数据仓库模型的设计。 2.5.1概念模型设计进行概念模型设计所要完成的工作是: v1>界定系统边界 <2>确定主要的主题域及其容概念模型设计的成果是,在原有的数据库的 基础上建立了一个较为稳固的概念模型。因为数据仓库是对原有数据库系统中 的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首 先要对原有数据库系统加以分析理解,看在原有的数据库系统中“有什 么”、“怎样组织的”和“如何分布的”等,然后再来考虑应当如何建立数据 仓库系统的概念模型。一方面,通过原有的数据库的设计文档以及在数据字典 中的数据库矣系模式,可以对企业现有的数据库中的容有一个完整而清晰的认 识;另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自 各个面向应用的数据库的数据提供了统一的概念视图。 概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用 考虑具体技术条件的限制。 1 .界定系统的边界 数据仓库是面向决策分析的数据库,我们无法在数据仓 库设计的最初就得到详细而明确的需求,但是一些基本的方向性的需求还是摆 在了设计人员的面前: .要做的决策类型有哪些? .决策者感兴趣的是什么问题? .这些问题需要什么样的信息? .要得到这些信息需要包含原有数据库系统的哪些部分的数据?这样,我 们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。 因而,从某种意义上讲,界定系统边界的工作也可以看作是数据仓库系统设计 的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出 来。 2,确定主要的主题域在这一步中,要确定系统所包含的主题域,然后对 每个主题域的容进行较明确数据仓库建模技术在电信行业中的应用的描述,描 述的容包括: .主题域的公共码键; .主题域之间的联系: .充分代表主题的属性组。 2.5.2逻辑模型设计逻辑建模是数据仓库实施中的重要一环,因为它能直 接反映出业务部门的需求,同时对系统的物理实施有着重要的指导作用。在这 一步里进行的工作主要有: .分析主题域,确定当前要装载的主题; .确定粒度层次划分; .确定数据分割策略; .关系模式定义; .记录系统定义逻辑模型设计的成果是,对每个当前要装载的主题的逻辑 实现进行定义,并将相关容记录在数据仓库的元数据中,包括: .适当的粒度划分; .合理的数据分割策略; .适当的表划分; .定义合适的数据来源等。 I ?分析主题域 在概念模型设计中,我们确定了几个基本的主题域,但是,数据仓库的设 计方法是一个逐步求精的过程,在进行设计时,一般是一次一个主题或一次若 干个主题地逐步完成的。所以我们必须对概念模型设计步骤中确定的几个基 本主题域进行分析,一并选择首先要实施的主题 域。选择第一个主题域所要考 虑的是它要足够大,以便使得该主题域能 建设成为一个可应用的系统;它还要 足够小,以便于开发和较快地实施。如果所选择的主题域很大并且很复杂,我 们甚至可以针对它的一个有意义的子集来进行开发。在每一次的反馈过程中, 都要进行主题域的分析。 乙粒度层次划分数据仓库逻辑设计中要解决的一个重要问题是决定数据仓 库的粒度划分层次,粒度层次划分适当与否直接影响到数据仓库中的数据量和 所适合的查询类型。确定数据仓库的粒度划分,可以使用在粒度划分一节中介 绍的方法,通过估算数据行数和所需的DASD数,来确定是采用单一粒度还 是多重粒度,以及粒度划分的层次。 3.确定数据分割策略在这一步里,要选择适当的数据分割的标准,一般要 考虑以下几方面因素:数据量〔而非记录行数)、数据分析处理的实际情况、 简单易行以及粒度划分策略等。数据量的大小是决定是否进行数据分割和如何 分割的主要因素;数据分析处理的要选择数据分割标准的一个主要依据,因 为数据分割是跟数据分析处理的对象紧密联系的;我们还要考虑到所选择的数 据分割标准应是自然的、易于实施的:同时也要考虑数据分割的标准与粒度划 分层次是适应的。 4.矣系模式定义数据仓库的每个主题都是由多个表来实现的,这些表之间 依靠主题的公共码键联系在一起,形成一个完整的主题。在概念模型设计时, 我们就确定了数据仓库的基本主题,并对每[、主题的公共码键、基本容等做了 描述在这一步里,我们将要对选定—的当前实施的主题进行模式划分,形成多 个表,并确定各个表的关系模式。 用关系型数据库来实现数据仓库信息模型时,目前较常用的两种建 模方法是所谓的第三式(3NF,gp Third Normal Form)和星型模式 Star-Schem司,我们将重点讨论两种方法的特点和它们在数据仓库系统中的 适用场合

文档评论(0)

文档查询,农业合作 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体土默特左旗农特农机经销部
IP属地内蒙古
统一社会信用代码/组织机构代码
92150121MA0R6LAH4P

1亿VIP精品文档

相关文档