建立数据仓库八条基本准则.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
建立数据仓库八条基本准则.doc

建立数据仓库的八条规则,尤其是如何建立第一个数据仓库。但实际上,对于如何建立一个成功的数据仓库,现实中不存在也根本不可能存在一个涵盖万千、放之四海而皆准的宝书。本文规则的意义在于帮助用户避免一些已知的缺陷。而对于那些不可避免的必然错误,这些规则会尽可能地帮助用户减轻可能带来的危害。 数据仓库应用具有从多个分散的部门级系统中捕捉大量共享信息的能力。它们可以将机构的原始数据有效地转化为有用的知识信息,于是这些知识信息就可以被用来进行战略决策支持,从而提高企业效益。在一个先进的数据仓库应用的帮助下,企业决策者可以从质量、区域收入和产量等基本面上对企业性能进行跟踪,并基于这些可靠的信息采取快速、明智的行动。 建立数据仓库的八条规则,尤其是如何建立第一个数据仓库。实际上,对于如何建立一个成功的数据仓库,现实中不存在也根本不可能存在一个涵盖万千、放之四海而皆准的宝书。几乎可以肯定的是,在建立第一个数据仓库的时候,用户肯定会犯错误,这是不可避免的。本文的规则的意义仅仅在于,帮助用户避免一些已知的缺陷。而对于那些不可避免的必然错误,这些规则会尽可能地帮助用户减轻可能带来的危害。 规则一:从小处着手 不要一上来就要完成一个大规模的企业范围的数据仓库,这样会使用户陷入逻辑、行政和财政的泥沼中而不能自拔。 数据仓库不是越大越有效,较小系统的价值对机构来讲可能会很大。例如,用户可以将第一个数据仓库的实现定位于一个特定的部门和应用或者业务线。初始时采用规模向下的数据集市可以降低开发成本,缩短实现周期,并有助于为未来的数据仓库的发展培训IT人员。 规则二:向大处考虑 即使在建立第一个面向特定部门或特定应用的数据集市时,也一定要保证现在所使用的数据模型能够向将来企业范围的数据存储扩展,以便于将来其他数据集市和战略数据仓库的实现。 必须在部门之间进行一致性数据定义,并使每个人都遵守。例如,如何构成一个销售体系?是预约登记、开发票还是付款?在这些定义上的一致性协议会使以后部门数据的联合成为可行、有效。 规则三:定义目标和量化收益 在项目开始实施以前,用户必须明确回答几个问题。我们为什么要建立一个数据仓库?项目的目的同我们机构的任务一致吗?哪些问题是我们致力于要去解决的?要考虑及时推入市场、质量和客户满意度等因素吗? 在进行了目标问题的认知以后,应该认清哪些是关键性的影响成功的因素,以便于在解决方案的实施进程中进行跟踪。例如,收益和运输单位(units shipped)可能是对丧失市场份额产生作用的两个影响因素。 在确立了这些关键的成功影响因素以后,用户就可以在应用中设置自动水开标记或警报。这些警报保证对底层产生直接影响的最重要数据是清晰可见的,便于及时采取行动。定义了成功的影响因素后,在使用数据仓库时就可以检测到威胁成功的因素。 一旦这些基本目标确立以后,下一个基本要求是对来自数据仓库的可预期的收益进行量化。只有在做了这些工作以后,管理层才会有据可依地判断一个数据仓库的成功与否。 量化的目标不一定非是数字或金融表达式,它们只需要明确、有意义即可。 许多机构都采用金融衡量标准,比如ROI,来对收益进行量化。IDC对62家数据仓库的实现进行研究表明,在数据仓库项目上的总体ROI为401%,平均回报时间为2~3年。数据集市的ROI经检验为533%。其他类型的收益衡量标准还包括成本节约程度以及可获得的能够进行衡量的效率。 规则四:取得最高管理层的支持和认可 数据仓库中涉及到信息的共享,这必然会由于部门数据所有者的人为因素造成失控。在数据所有权和数据存放等问题上的内部纷争,很容易给数据仓库带来进程上的滞延和失败。 这种数据上的割据必须在项目的开始就立即加以解决。理想的情况是,公司最高管理层的一个或者几个成员能够为数据仓库进行部门或部门之间的对象设置。管理层的支持有助于打破各个部门之间日益严重的由于数据保护而形成的行政壁垒。 在整个过程中,终端用户也是一个不可忽视的因素。如果那些首先进行数据输入的人员不了解数据仓库的意义,用户很容易地陷入一摊垃圾数据中。用户用来决策的数据应该同最初输入的数据一样好。 规则五:等待完美不会带来收益 如果已经进行了目标定义,明确了关键的成功影响因素,并且数据仓库项目的规模得到了合理的控制,那么就不要永久地等待下去,因为这样下去什么也不会得到。尽快行动起来,开始分享数据仓库投资带来的回报。用户不应拘泥于所谓的完美不放,一旦客户开始访问到新数据仓库中的信息,研究结果展现在他们的面前,他们很快会发现自己需要更多的信息和更详细的细节。 研究表明,数据仓库以每年大约40%的速率在增长。随着用户需求的发展,应用能够不断修改与之适应。这种方式是一个垒砖的方式,迈向数据仓库的第一步路就是快速实现它。 规则六:选择能够与用户需求匹配的系统 如上所述,要认识

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档