基干元数据管理可扩展数据仓库系统设计.doc

基干元数据管理可扩展数据仓库系统设计.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基干元数据管理可扩展数据仓库系统设计

基干元数据管理可扩展数据仓库系统设计   摘 要:数据仓库系统在创建、维护过程中,随着数据的飞速膨胀与用户需求的不断变化,应根据应用的实际情况增减新的组件以提高数据仓库的综合性能。结合新形势下的多应用组件需求,文章提出了基于元数据管理的设计方案实现可扩展的数据仓库系统,通过元数据管理与接口设计对数据仓库进行规范和组织,解决了数据仓库系统各层数据的交互问题,同时增强了数据仓库系统的扩展性,提高其应用的多样性和适应性 关键词:数据仓库;元数据;体系结构;接口 1 概述 数据仓库所要管理的数据量要远远多于传统系统所管理的数据量,随着时间的推移数据仓库平台必须支持更多的数据和用户、更多的和复杂的查询处理,随着系统功能的增加,在应用接入的同时需要保持原有能力,并能够加载新应用,结合各类需求使得数据仓库系统需要支持可扩展 在传统数据仓库设计的体系结构下,系统内部结构耦合程度高,OLAP与数据挖掘功能组件结合紧密。当前,增加数据仓库系统体系结构的可扩展性主要有两种模式:一种主要研究系统部件模块化和分层策略提高数据仓库的可扩展性。如基于Web的数据挖掘算法与数据仓库的接口设计[1],将算法库模块化并解决了算法与数据仓库的接口问题;基于Agent的三层数据仓库系统体系结构的研究,将软件Agent引入数据仓库系统,增强了系统的伸缩性,拓广了数据仓库的应用领域[2]。另一种是采用高性能软硬件、并行计算机系统结构,用可扩展的软件并行和硬件并行相结合的方法进行数据仓库的性能扩展。如采用高速缓存相关的非一致性内存访同结构,并且较好地利用I/O并行性,解决大量异构数据涌入可扩展数据?}库中时系统性能问题;采用并行技术实现基于可扩展的数据集市的数据仓库系统结构[3]等 在数据仓库系统的设计过程中,如果采用多层扩展或分层内部模块化方式实现扩展,系统中单一层模块不断增加,层内部件耦合度不断提高,降低了系统的可维护性。而采用高性能软硬件、并行解决方案,除考虑费用问题外,还需建立高性能平台。如果其中某个组件性能较弱,将会影响整个数据仓库系统,增加了数据仓库系统开发与维护的难度 为更有效地适应数据的飞速膨胀与用户需求的不断变化,管理分布的、异构的集成环境,保持数据仓库系统层次的独立性和自主性,减轻开发与维护的负担,作者提出了基于元数据管理的可扩展数据仓库系统体系结构与接口设计方案,通过层次与模块自定义扩展提高数据仓库的可扩展性,增强系统的可扩展性和可维护性 2 基于元数据管理的数据仓库系统 体系结构:基于元数据管理的可扩展数据仓库系统模型体系结构如图1所示,包括元数据管理层、数据存储层、数据处理层、前端应用层。随工作负载的增加,数据仓库系统需要进行功能扩展时,元数据层通过对接口文件的管理,将完成层次的增删。完成数据仓库逻辑层次与物理层次的实际扩展,保证了数据仓库系统体系结构的清晰性与可扩展性 (1)元数据管理层 元数据管理层包括元数据获取、元数据存储、元数据服务接口、元数据管理和元数据应用等组件,在系统执行过程中完成任务接受、任务分解、系统管理、请求判断、日志记录等功能。存储的元数据包括技术元数据(Technical Metadata)和业务元数据(Business Metadata)。为实现可扩展的数据仓库系统,将元数据分为基础元数据、运行元数据和映射元数据三类,系统应用以组件形式加载,通过接口实现各层关联 (2)数据存储层 数据存储层主要由原始数据和结果数据构成。原始数据为数据仓库中所存储的各类应用多源数据;结果数据由各类数据分析和挖掘服务计算产生 (3)数据处理层 数据处理层中集成各类数据集成工具、多维分析工具、数据挖掘工具等,完成原始数据处理形成结果数据,为用户提供决策支持 (4)前端应用层 前端应用层完成对用户输入参数的获取,以数据流的形式提供给诸如元数据层进行分析。本模块通过使用系统web页面获取所需数据,参数获取的方式是调用可视化系统中关于应用请求的API接口 3 接口设计 为实现各功能组件能够访问数据仓库与增强数据仓库系统的可扩展性,需要对数据仓库各层之间的接口进行设计(图2所示)。通过接口设计对各层进行必要的规范和组织,数据仓库中每层都按照该规范和定义建立相应的模型构造,各层独立并通过接口进行交互,各层内部实现封装。系统数据传输过程从接口文件开始,需要对接口进行规范化描述,以保证接口文件的质量和数据抽取流程的正确 (1)元数据层服务控制中心 系统以元数据层组件构成服务控制中心,实现数据仓库的可扩展性;建立模型管理库,为上层协同服务集成提供各种应用接口;构建可扩展的数据挖掘平台示范应用。元数据层的对外接口模块有数据存储层模块、数据处理处理模块和前端应用层接

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档