网站大量收购独家精品文档,联系QQ:2885784924

基于大数据的数据质量评估方法研究 .pdfVIP

基于大数据的数据质量评估方法研究 .pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于大数据的数据质量评估方法研究

作者:周艳红

来源:《现代信息科技》2020年第08期

摘;要:大数据质量评估是大数据产业化道路上较为突出的挑战之一,故文章基于重庆工

商大学2019年研究生创新型科研项目和数理统计团队培养项目,对大数据质量评估方法进行

深入研究。首先,通过对大数据质量评估的现有方法进行简要综述,选取数据生命周期分析研

究视角;其次,分析大数据质量的影响因素,从原始质量、过程质量和结果质量3个维度确定

了15个大数据质量度量指标;最后,运用层次分析法和专家打分法建立大数据质量评估模型。

关键词:大数据;数据质量;质量评估;综合评价

Abstract:Bigdataqualityassessmentisoneofthemoreprominentchallengesontheroadtobig

dataindustrialization.Therefore,basedonthe2019graduateinnovativescientificresearchproject

andmathematicalstatisticsteamtrainingprojectofChongqingTechnologyandBusinessUniversity,

in-depthresearchonbigdataqualityassessmentmethodsiscarriedout.First,throughabriefreview

perspective;secondly,theinfluencingfactorsofbigdataqualityareanalyzed,and15bigdata

qualitymeasurementindexesaredeterminedfromthreedimensionsoforiginalquality,process

qualityandresultquality.Finally,abigdataqualityevaluationmodelisestablishedbyusingAHP

andexpertscoringmethod.

Keywords:bigdata;dataquality;qualityassessment;comprehensiveevaluation

引0;;言

当前,我国大数据产业蓬勃发展,但也面临着诸多挑战。例如,宗威和吴锋[1]指出,定

义的统一性、数据质量问题、数据存储技术、数据分析方法是大数据为中国甚至全世界企业提

出的挑战。李学龙[2]表示,目前大数据系统面临着冗余缩减和数据压缩、数据生存周期管理

等挑战,亟需评估大数据的数据质量。王宏志[3]指出,由于大数据具有“4V”特征,其更易产

生数据质量问题。

数据质量的好坏,将决定数据分析结果的有效性,并引导管理者作出相应决策。一旦数据

质量恶劣,必将对决策产生误导,对企业甚至社会造成不利影响。因此,亟需学界和业界加强

对大数据质量管理的研究,提出有效的评估方法和管理系统等。目前,不少学者围绕大数据质

量评估展开了研究,取得了一系列的研究成果,然而,大数据正处于发展上升期,其发展的同

时也产生了新的问题,给数据质量评估带了新的研究机遇。

为此,笔者基于重庆工商大学2019年研究生创新型科研项目和数理统计团队培养项目,

对大数据质量评估方法进行深入研究。现对大数据质量评估的现有方法进行简要综述,分析大

数据质量的影响因素,并采取适当的手段建立基于大数据的数据质量评估方法,以便用户对数

据进行判断和抉择,进而提高大数据的使用价值。

大数据质量评估方法1;研究现状

大数据1.1;及其质量的内涵

近年来,研究人员对大数据的研究愈发深入,大数据的定义与特征呈现多元化。例如,研

究机构Gartner[4]给出的定义是:大数据是需要新处理模式才能具有更强的决策力、洞察发现

力和流程优化能力的海量、高增长率和多样化的信息资产。彭宇[5]等认为,大数据是一种对

数据管理和处理技术要求更高,且能反映“大决策”“大知识”“大问题”的数据集。刘洋[6]指出,

大数据是常规软件及工作难以在规定时间内对海量数据进行收集、处理和整理时,需要依托全

新的处理方法才能实现更强的决策力、洞察力、高增长率以及多样化的信息资产。目前,在大

数据定义问

您可能关注的文档

文档评论(0)

152****2617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档