国家级石油数据中心建设与POSC系列标准.docVIP

国家级石油数据中心建设与POSC系列标准.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家级石油数据中心建设与POSC系列标准 袁 满 yuanman@263.net (黑龙江省 大庆市 大庆石油学院 计算机学院) 1引言 信息技术的应用已经深入到石油工业应用中的各个环节。而且随着石油工业的发展,积累的信息呈爆炸式增长。存储与维护这些信息的费用也越来越高,尤其是随着石油市场竞争日趋激烈,迅速而准确地从现有的信息中抽取出有用的决策信息是现代石油生产、销售与管理等迫切需求的。而以往只是面向应用的数据模式的应用已经满足不了这种需求。随之而来的一种面向主题的联机分析与决策应用便应运而生。正是在这种应用需求的驱动下产生出了适合这种应用需求的数据仓库技术。 进入90年代,世界上一些国家的油公司、石油协会、石油相关的组织、一些大学及研究机构联合先后建立了自己的数据仓库,这些国家从这些数据仓库中得到了相当的效益,为油田的勘探、开发等提供了可靠的、科学的决策依据。自90年代初至今,世界许多著名的油公司与相关组织联合发起并成立了POSC,旨在为世界油田勘探与开发制定一套集数据集成、软件集成等于一体的标准,而且这些标准已经越来越被各国的油公司所认可。这些标准必将成为世界共同的财富,必定会促进油公司信息系统建设,并为其建设提供可参考与可实施的标准。 本文主要讨论了三个主要的问题:一个是讨论了数据仓库及相关技术;接着讨论了POSC的系列标准;最后给出了世界上数据仓库成功的案例-美国国家地球科学数据仓库系统(NGDRS)。 通过本文的讨论,旨在说明数据仓库建设在石油生产、管理等各个领域的应用潜力;提到数据中心建设就必然会涉及到标准问题,而POSC系列标准正是为这一目的而制定的。POSC系列标准经过10多年的发展与完善已经越来越得到世界的认可,尤其POSC组织目前正在进行的基于电子商务的石油数据交换规范更加细致与实用,这些为我们的信息建设提供了可参考的标准。并全通过一些大组织在信息建设中对POSC系列标准的采用的实践已经证明了POSC系列标准的先进性。 2数据仓库体系结构及相关技术 2.1 数据仓库的概念及特点 近年来,数据仓库技术已经成为计算机领域中的热门话题。这主要是因为:首先,从计算机的应用需求上讲,由于全球范围内的经济、贸易以及军事、科技等领域竟争的激烈,给传统的信息产业提出了新的问题和挑战,使得传统的信息技术在处理某些复杂问题上显得力不从心;另一方面,从现实的技术发展角度上来看,目前计算机科学以及相关领域的技术实现了突飞猛进的发展,使得它们之间的相互协同成为可能,并达到使数据仓库技术走向实用的程度。 数据仓库的概念最早是由W.H. Inmon和Richard Hackathorn在他们的著作中提出来的。他们对数据仓库是这样定义的:数据仓库是信息技术构架的新焦点,它提供集成化的和历史化的数据,它集成种类不同的应用系统,数据仓库从发展和历史的角度来组织和存储数据,以供分析与处理使用。这里的的集成化数据是指数据在结构上具有综合性而且在语义上是异构的;历史化的数据表明数据仓库中包含的数据是一段历史性的数据,它既包括某一点上的瞬间信息,同时也包含一个区段上的信息;集成种类不同的应用系统说明数据仓库不仅仅是数据的仓库,同时也是软件的仓库。其中的数据一般按应用主题进行组织与存储。 也有人将数据仓库抽象地定义为:数据仓库是决策支持技术的集合,其目的是利用所存储的知识做出更好、更快的决策。数据仓库体系结构见图 1。也有人将数据仓库定义为:面向主题的、集成的、随时间变化的、用来支持组织决策的稳定数据的集合。不管哪种定义,它们均有共同的特点: ● 数据仓库需要为决策提供综合信息,因此,它是以企业业务的主题内容来组织数据。这样的组织形式使得提供的信息具有全方位的可用性。 ● 数据仓库中所保存的数据,虽然来自于日常的运行,但是它是经过加工、重组的数据。因此它所存储的数据是源数据的增值和统一,并不是简单的拷贝。 ● 数据仓库不仅仅是“数据的仓库”,而且也是“软件的仓库”,至少它应该包含对数据的变换功能。 ● 数据仓库还需要处理历史数据。任何的数据都带有时间标记,这将为实现预测奠定基础。 ● 数据仓库应当能够通过信息以及服务来反映企业的业务模型,实现数据的逻辑模型。 ● 对于行业的数据仓库必须定义统一数据标准。 2.2 组成数据仓库的部件 从图1可以看出,数据仓库的组成结构。它包括各种各样的工具:这些工具负责从若干个运行着的外数据库及外部数据源中抽取数据,并负责对这些数据的清洗、变换与集成,同时还负责向数据仓库中加载数据;这些工具还要周期地对数据仓库进行更新,并负责对数据仓库中一些归档数据的净化。除了主数据仓库之外,可能还会存在一些部门级的数据集市。存储在数据仓库或数据市场中的数据可能被一个或若干个数据仓库服务器负责管理,这样对不同的前端工具会

文档评论(0)

rpv75l07 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档