- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库技术的设计应用
数据仓库技术的设计应用
【摘 要】数据仓库在现代计算机应用中的作用日益突出,本文的目的旨在提出数据仓库体系结构的基础上,分析数据仓库技术设计中的注意要点。
【关键词】数据仓库 设计 数据装载
数据仓库 (Data Warehouse) 概念起源于 80 年代中期,在 90 年代,数据仓库技术已经成为一大热点。遍及世界的公司都在试图利用多年来存储在他们计算机内的信息。数据仓库的概念是经过被誉为“数据仓库之父”的 W. H.Inmon 加以定义与发展的。 W. H.Inmon 对其定义为:“数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。”数据仓库有别于运作中的数据库,数据仓库是一个综合的解决方案,而数据库只是一个现成的产品而己。后者以多种方式支持在线事务处理 OLTP (On-Line Transaction Processing) ,而前者主要支持在线分析处理 OLAP (On-Line Analysis Processing) 。
一、数据仓库的介绍
在数据仓库工程中,设计数据仓库的体系结构是一个关键的环节。数据仓库工程所要达到的诸多目标,如改善服务质量、降低经营成本、加快新产品和新服务品种的开发速度、加强企业对竞争环境的响应效率等,都要落实体现到合理可行的数据仓库体系结构设计中,而数据访问则是整个数据仓库体系结构的核心问题。
数据仓库技术从本质上讲,是一种信息集成技术。数据仓库从多个信息源中获取原始数据,经整理加工后,存储在数据仓库的内部数据库中,通过向用户提供访问工具,向数据仓库的用户提供统一、协调和集成的信息环境,支持企业全局的决策过程和对企业经营管理的深入综合分析。为了达到这样的目标,一个数据仓库一般来说包含以下七个主要组成部分:数据源、数据抽取,转换和装载工具、数据建模工具、核心仓储、数据仓库的目标数据库、前端数据访问和分析工具以及数据仓库管理工具。
我们可以看到,在一个数据仓库中,提供源数据的数据源既可以是各种数据库管理系统,也可以是各种格式的数据文件或外部的数据源。因此,数据仓库需要有相应的工具从数据源中抽取数据。数据进入数据仓库之前,通过数据抽取和转换工具来完成数据的检验、整理、加工和重新组织,然后装载到一个或多个数据仓库的数据库中。
随着企业的业务发展,数据仓库管理人员可以通过使用数据建模工具,根据企业决策和综合分析的需要,对数据的检验、整理、加上和重新组织的过程进行调整和优化。而对数据的检验、整理、加工和重新组织过程的描述,则是以数据模型和元数据的形式,存放在核心仓储中。
为了使数据仓库用户能有效地使用数据仓库中的信息,进行深层次的综合分析和决策,数据仓库系统要向用户提供一整套数据访问和分析工具。数据访问和分析工具不但要提供一般的数据访问功能,如查询、汇总、统计等,还要提供对数据的深入分析功能,即数据挖掘的功能,如数据的比较、趋势分析、模式识别等。
二、数据仓库的数据库设计
在数据仓库中,设计信息结构的目的就是要建立一个面向决策支持的优化的信息视图,使得数据仓库的用户能够方便地理解有关的信息结构,以便充分利用数据仓库中存储的信息,为业务决策和深层次的业务分析服务。这个设计目标决定了数据仓库的数据库与一般联机事务处理系统的数据库有所区别,在设计工作的出发点、考虑的侧重点、主要的设计方法及技术等方面都有所不同。在数据仓库工程实践中,设计数据库时要重点注意四个方面的问题:
1 .设计一个简明的数据模式
在我们熟知的传统 OLTP 系统中的数据库模式中往往包含了许多表,表之间的联系比较多,也比较复杂。在这样的数据模式中,提高了数据的插入、删除和修改等操作的效率,但数据查询的效率却降低了,而且,数据模式复杂,不容易理解,这为编写复杂的数据查询增添了许多困难。在数据仓库系统中,主要从事联机分析处理,如果数据库的数据模式仍然按这种方式来设计,显然不能适应应用的需要了。
在数据仓库环境中,数据一次性装入数据库中,一般不再进行插入、更新等操作,根据系统对数据周期的要求,采用批处理方式进行数据整理,对过时的数据进行删除或移存。因此,在数据仓库环境中,对数据的插入、删除和更新操作的时间要求比较低。但由于要进行支持决策过程的数据深入分析工作,所以查询住往比较复杂,而且没有确定的方式,业务分析人员往往不断提出新的需求。如果采用复杂的数据模式,一方面难于理解,不容易编写数据查询;另一方面查询的性能也不高,需要特殊的技巧。因此,必须设计简单的数据模式,让即使不具备数据库专门知识的业务专家也能比较容易地理解和使用数据仓库中数据库的数据模式。
2 .保证数据的一致性
在数据仓库的设计中,一定要保证数据仓库的数据库中的数据是一致的,即往数据库输入的数据和数据库所输出的数据是一致的
您可能关注的文档
- 师资队伍建设规划撰写提纲.docx
- 帕金森病非运动症状的研究进展docx1.docx
- 平稳过渡到“二孩时代”.doc
- 平行线与相交线测试题2.docx
- 平菇高产管理.doc
- 市场营销电子商务方向毕业论文开题报告.doc
- 平行线与相交线测试题3.docx
- 市场营销作业三.doc
- 市民参与城市管理的价值与方式讨论提纲.doc
- 年度应急演练工作总结.docx
- 中国国家标准 GB/T 20867.1-2024机器人 安全要求应用规范 第1部分:工业机器人.pdf
- 《GB/T 20867.1-2024机器人 安全要求应用规范 第1部分:工业机器人》.pdf
- 《GB/T 23423-2024飞机主舱集装货物装载机》.pdf
- GB/T 23423-2024飞机主舱集装货物装载机.pdf
- 中国国家标准 GB/T 23423-2024飞机主舱集装货物装载机.pdf
- 《GB/T 4706.114-2024家用和类似用途电器的安全 第114部分:饮用水处理装置的特殊要求》.pdf
- 中国国家标准 GB/T 4706.114-2024家用和类似用途电器的安全 第114部分:饮用水处理装置的特殊要求.pdf
- GB/T 4706.114-2024家用和类似用途电器的安全 第114部分:饮用水处理装置的特殊要求.pdf
- GB/T 4706.120-2024家用和类似用途电器的安全 第120部分:紫外线辐射水处理器具的特殊要求.pdf
- 中国国家标准 GB/T 4706.120-2024家用和类似用途电器的安全 第120部分:紫外线辐射水处理器具的特殊要求.pdf
文档评论(0)