- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
《冶金自动4匕}2014年S1
宝钢全流程合同数据清洗与组织方案的设计和应用
汪 爱 民
(宝山钢铁股份有限公司营销管理部,上海201900)
摘要:随着信息系统的逐步建成、稳定运行和持续改善,gth钢铁股份有限公司应用跨系统平台数据整合清洗
技术,确保多系统、全品种、全流程海量合同数据的质量,同时设计面向业务的基础数据主题集和面向应用的应
用数据主题集,分层式主题结构及星型主题设计实现主题数据层的灵活性和可扩展性,为公司的经营管理分
析、数据挖掘、决策支持和价值提升夯实了基础。
关键词:数据仓库;数据清洗;数据组织;数据主题集
O 引言
数据源层 操作数据层 ’主题数据层
随着宝山钢铁股份有限公司(简称:宝钢股
份)钢铁主业信息化建设的不断深入,在营销数据
仓库中汇集了大量的生产制造、经营管理等方面 ’各属地f (当撒据(, . … (]
潮造系统、,
的数据。其中,由于宝钢产销的特点,合同分制 ) 夕
隐部销售、 全流程合f’
造、总部销售、渠道销售多个环节。虽然合同执行 .系统.』 U 。同数据主题I.
过程中各重要节点的数据已汇集至数据仓库,并 f渠道销售f1 (历一() ( … (:
I系统\,
可以分别在数据仓库不同的功能中进行查询,但
由于不同节点的数据来源众多,代码不完全一致,
图1 原始数据整理部分框架
数据质量参差不齐,且存在部分异常数据,如不进
行系统地组织、清洗与整合,无法保证合同执行全 数据源经过ETL(抽取、转化、装载)过程以统一的
周期情况分析的正确性和合理性。 数据格式存储在数据仓库的ODS(操作数据存储)
数据仓库中的数据清洗与组织是数据仓库技 层。ODS层既包括各系统的当前数据,同时也包
术的核心,宝钢股份合同执行周期相关的数据清 括历史数据。按照特定的业务需求,将ODS中相
洗与组织的设计及应用跟宝钢的信息系统应用水 关的数据按照特定的键值组合在一起形成新的数
平是紧密联系的。本文通过数据仓库在钢铁企业 据集合,用以支持进一步的分析。这样的数据集
的应用实例,具体介绍宝钢股份在数据仓库平台 称为主题数据集。
上全流程合同数据的清洗与组织设计方案。 2数据的清洗与组织方案
1系统数据来源 宝钢股份合同执行过程中主要包括合同签
数据仓库是在企业管理和决策中面向主题 订、生产、出厂、在途、地区公司出人库、JIT(合同
的、集成的、与时间相关的、不可修改的数据集合。 即时交付)等重要节点,这些重要节点的数据来源
按照数据仓库的设计思想结合应用实例,宝钢股 于不同的系统,他们之问都是相对独立的。合同
份营销数据仓库的原始数据整理部分包括数据源 签订的数据来源于总部合同库数据集,生产数据
层、操作数据层、主题数据层。具体架构如图1 来源于各制造单元上传的生产数据集,出厂数据
所示。 来源于总部物流管控相关的数据集,在途、地区公
数据源层包括宝钢股份各属地生产
文档评论(0)