- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据集市开发方法 9 自下而上方法 9.2 自下而上方法 对于独立型数据集市,采用自下而上方法 首先就某一个特定的主题先做独立的数据集市 当数据集市达到一定的规模,再从各个数据集市进行数据的再次抽取建立企业级数据仓库 有一定级别的冗余和不一致性 不过是一个切实可行的方法 数据集市开发方法 9 自下而上方法 9.2 局部数据集市 外部数据 操作型数据 (全部) 操作型数据 (局部) 操作型数据 (局部) 局部数据集市 数据集市开发方法 9 混合方法 9.3 前面两种方法都有优缺点 自上而下方法 建设之初很难提出比较清晰的需求,需求难以确定; 项目实施周期较长,难度和投资巨大,风险高 自下而上方法 开始建立的数据集市之间矛盾和不一致的数据 建立数据仓库时,需要再次抽取、转换、清洗和集成,工作量大 混合方法(Ralph Kimball) 从整个公司角度来计划和定义需求 为完整的数据仓库设计一个体系结构 使数据内容一致而且标准化 将数据仓库作为一组超级数据集市来实施,每次一个 数据集市的实施 10 实施方针 10.1 和数据仓库采用不同的实施队伍 数据集市和数据仓库的需求不尽相同 数据集市往往是即时性战术需求 数据集市的精心策划可应用到数据仓库中 数据集市的项目负责人和数据仓库的负责人应该密切合作,相互沟通,以减少多余的数据调查工作。 在数据集市数据调查过程中采集的信息可以存储起来,通过提取和转换,成为新的数据仓库的数据元素。 数据集市的实施 10 实施方针 10.1 业务领域对于战术型解决方案的需求更加敏感 由于来自商业用户对关键数据需要的压力,企业必须确定哪些领域迫切需要建设数据集市。这一步骤要得以迅速实施,必须对使用的数据进行分析,并且挑选出业务领域中对数据要求的重叠部分,这样才能减少数据调查 的工作量和实施的时间。 把数据源限制在3个 数据获取是数据集市和数据仓库建设中最复杂的部分。有些企业只有一个或两个关系数据库作为数据源,但是由于一般的IS部门支持5 ~8种数据管理技术和30 ~50个数据存储点,数据获取和集成的复杂性就很快成为数据集市建设中最难掌握的问题了。假如数据源超过3 个,并且这些数据源都是很关键的,那么就应该考虑建立另一个数据集市了。 数据集市的实施 10 实施方针 10.1 制定一个政策来预防数据集市的膨胀 每一个数据集市的实施都增加了数据获取和维护的过程,这个过程增加了运行、维护和管理费用。原来被认为是运行系统维护的子项目,现在变得更加复杂。企业因此应该制定政策,预防数据集市的膨胀,一旦数据仓 库建成,就可以用作数据集市的数据源。 总 结 ODS的定义和特点 DB-ODS-DW体系结构 建立ODS ODS案例 数据集市的定义 数据集市的特点 数据集市与数据仓库的区别 数据集市的类型 数据集市的开发方法 数据集市的实施 徐俊刚 (xujg@gucas.ac.cn) 2009年9月——2008年11月 ODS的定义和特点 DB-ODS-DW体系结构 建立ODS ODS案例 数据集市的定义 数据集市的特点 数据集市与数据仓库的区别 数据集市的类型 数据集市的开发方法 数据集市的实施 操作数据存储(ODS)和数据集市 第3章 ODS的定义和特点 1 ODS的由来 1.1 ODS由来 DB数据环境:面向应用和联机事务处理,当前的、细节的、分散的数据,不能提供集成的统一的数据环境,共享程度低,不能提供决策支持。 DW数据环境:面向高层、面向分析,可以提供集成、统一的数据环境,但是一定量的数据是建立DW的前提,需要使用历史数据,数据要体现集成性和历史性 实际中往往会有实时决策的需求,上述两者都不能满足要求,因此产生了ODS ODS数据环境:一方面提供全局一致的、细节的、当前的数据,可进行联机事务操作型处理。另一方面是一种面向主题的集成的数据环境。数据量小,可辅助完成日常决策的数据分析处理,同时可以保护投资,保留现有的应用系统。 ODS的定义和特点 1 ODS的定义 1.2 ODS定义 ODS是Operational Data Store的简称,翻译成操作数据存储。 ODS是数据仓库体系结构的一部分,可以根据需要选择是否采用ODS。 它具备数据仓库的部分特征和OLTP的部分特征。 ODS是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全局信息的需求。常常被作为数据仓库的过渡。 作为一个中间层次,它既不是联机事务处理,也算不上高层决策分析,是不同于 DB 的一种新的数据环境,是数据仓库扩展后得到的一个混合形式。 ODS支持对数据的联机修改——增、删与更新等操作 ODS的定义和特点 1 ODS的特点 1.3 ODS特点 面向主题的(
文档评论(0)