ETL技术在电信数据运营中应用.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ETL技术在电信数据运营中应用

ETL技术在电信数据运营中的应用   摘要:在当今“大数据”爆发时代,可用信息是现代企业的重要资源,是企业进行科学有效的管理和进行正确决策分析的基础,如何对数据进行处理也已经成为每个企业在经营过程中的重要环节,使用计算机技术实现数据的自动化地调度更是成为了一种必然趋势。现今,很多企业仍然没有最大化地利用已存在的数据资源,况且对大量数据的重复、粗暴、简陋的处理也.耗费了大量的人力物力,也耽误了最佳的商业决策时机。所以,对数据进行有效地清洗及自动化固化可以极大地减少企业的人力及时间成本,为企业节省更多的成本。而对海量数据的处理就用到了数据仓库技术――ETL(Extract-Transform-Load) 关键词:经营分析;数据处理;Oracle;ETL;数据清洗,数据抽取;数据挖掘 中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)24-0256-02 1 ETL技术在电信数据运营中的应用现状 1.1背景介绍 近年来随着“大数据”不断地提出,对海量数据的处理也逐渐面临巨大挑战。而随着中国电信市场份额的日益壮大以及竞争愈加激烈的信息市场,对数据的处理程度将成为重要的一环 对于电信行业来说,存在着庞大的数据信息,而运营商想要在市场上站稳脚步,就要建立以目标客户为中心,适应市场机制的运营计划,那么就要必须及时地了解市场的动向,准确的做出战略调整。这激烈的市场竞争要求电信业对客户的需求,以及对隐藏的客户都有着灵敏的感知度,而这所有的有效信息都来源于数据之中,所以如何让对海量数据进行处理,对数据进行有有效、及时的处理成为了电信业企业竞争的一个核心 1.2国内外现状分析 目前,国外的电信运营公司大部分也都已经有了稳定的框架模型,而且也在实际的运营中,在商业决策中都将数据挖掘提上议程,并且,在此基础上,将数据挖掘提升为成自动化技术,以指导公司运营战略性决策的制定。而在于我国,ETL在电信中的运用已得到极大地重视,但是整体的发展起步较晚,还处于初级阶段, 鉴于我国这一国情,我们的电信业经营分析系统数据仓库的构建流程就不得不经常变动随时调整来适应实际运营中的现实问题。通过ETL的构建对大量数据的处理,从而节省人力物力,使运营商的运营成本得以大大减少,所以,如何建立好自己的经营分析系统是每一个运营商和系统开发商都不得不面对的问题和挑战 1.3 ETL技术在电信运营分析中的应用实例 中国电信集团公司**分公司对地下各地市每天都要将大量数据上传至集团公司 集团公司需要对对海量数据进行清洗,根据口径整理所需字段,梳理出当天的运营情况,将日数据清洗之后对大量数据还需要再次进行整合成月数据进行处理,并且需要根据这些数据制定电信集团**分公司的具体的运营计划或方针,可是,在对数据的处理过程中或会发现存在大量的重复工冗余作,不但浪费了大量的人力,也会浪费不必要的时间,所以为了避免人力和时间的浪费,所以把以oracle来处理数据的脚本,以存储过程固化,再运用ETL调度平台对其进行任务配置,当集团下分属公司将数据定时提交上来之后,集团公司公司就可以运用ETL调度平台对数据进行自动化的处理,节省人力物力 2 ETL技术介绍 2.1 ETL技术的定义 ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL这个词在数据仓库方面用得比较多,但是,ETL的对象并不只是局限于数据仓库一个 ETL在构建数据仓库当中是非常重要的,用户要将数据加载至数据仓库中,并且需要按照提前规划好的模型数据仓库,首先要将所需数据从数据源抽取出来,第二步再将抽取出来的数据进行清洗 2.2 ETL工具应用 ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS、Beeload、Kettle、久其ETL等 开源的工具有eclipse的etl插件:cloveretl 数据集成:快速实现ETL ETL的质量问题具体表现特性主要有:正确性;完整性;一致性;完备性;有效性;时效性;可获取性等 而有很多的原因会影响ETL的质量从而导致问题出现,由系统集成和历史数据造成的原因主要包括:1)业务系统不同时期系统之间数据模型不一致;2)业务系统不同时期业务过程有变化;3)旧系统模块在运营、人事、财务、办公系统等相关信息的不一致;4)遗留系统和新业务、管理系统数据集成不完备带来的不一致性 ETL的实现,第一步是要实现ETL转换的过程。具体体现在以下几个方面:1)空值的处理;2)规范化数据格式;3)拆分数据;4)验证数据正确性;5

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档