- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于大数据的数据质量评估方法研究
作者:周艳红
来源:《现代信息科技》2020年第08期
摘;要:大数据质量评估是大数据产业化道路上较为突出的挑战之一,故文章基于重庆工
商大学2019年研究生创新型科研项目和数理统计团队培养项目,对大数据质量评估方法进行
深入研究。首先,通过对大数据质量评估的现有方法进行简要综述,选取数据生命周期分析研
究视角;其次,分析大数据质量的影响因素,从原始质量、过程质量和结果质量3个维度确定
了15个大数据质量度量指标;最后,运用层次分析法和专家打分法建立大数据质量评估模型。
关键词:大数据;数据质量;质量评估;综合评价
Abstract:Bigdataqualityassessmentisoneofthemoreprominentchallengesontheroadtobig
dataindustrialization.Therefore,basedonthe2019graduateinnovativescientificresearchproject
andmathematicalstatisticsteamtrainingprojectofChongqingTechnologyandBusinessUniversity,
in-depthresearchonbigdataqualityassessmentmethodsiscarriedout.First,throughabriefreview
perspective;secondly,theinfluencingfactorsofbigdataqualityareanalyzed,and15bigdata
qualitymeasurementindexesaredeterminedfromthreedimensionsoforiginalquality,process
qualityandresultquality.Finally,abigdataqualityevaluationmodelisestablishedbyusingAHP
andexpertscoringmethod.
Keywords:bigdata;dataquality;qualityassessment;comprehensiveevaluation
引0;;言
当前,我国大数据产业蓬勃发展,但也面临着诸多挑战。例如,宗威和吴锋[1]指出,定
义的统一性、数据质量问题、数据存储技术、数据分析方法是大数据为中国甚至全世界企业提
出的挑战。李学龙[2]表示,目前大数据系统面临着冗余缩减和数据压缩、数据生存周期管理
等挑战,亟需评估大数据的数据质量。王宏志[3]指出,由于大数据具有“4V”特征,其更易产
生数据质量问题。
数据质量的好坏,将决定数据分析结果的有效性,并引导管理者作出相应决策。一旦数据
质量恶劣,必将对决策产生误导,对企业甚至社会造成不利影响。因此,亟需学界和业界加强
对大数据质量管理的研究,提出有效的评估方法和管理系统等。目前,不少学者围绕大数据质
量评估展开了研究,取得了一系列的研究成果,然而,大数据正处于发展上升期,其发展的同
时也产生了新的问题,给数据质量评估带了新的研究机遇。
为此,笔者基于重庆工商大学2019年研究生创新型科研项目和数理统计团队培养项目,
对大数据质量评估方法进行深入研究。现对大数据质量评估的现有方法进行简要综述,分析大
数据质量的影响因素,并采取适当的手段建立基于大数据的数据质量评估方法,以便用户对数
据进行判断和抉择,进而提高大数据的使用价值。
大数据质量评估方法1;研究现状
大数据1.1;及其质量的内涵
近年来,研究人员对大数据的研究愈发深入,大数据的定义与特征呈现多元化。例如,研
究机构Gartner[4]给出的定义是:大数据是需要新处理模式才能具有更强的决策力、洞察发现
力和流程优化能力的海量、高增长率和多样化的信息资产。彭宇[5]等认为,大数据是一种对
数据管理和处理技术要求更高,且能反映“大决策”“大知识”“大问题”的数据集。刘洋[6]指出,
大数据是常规软件及工作难以在规定时间内对海量数据进行收集、处理和整理时,需要依托全
新的处理方法才能实现更强的决策力、洞察力、高增长率以及多样化的信息资产。目前,在大
数据定义问
您可能关注的文档
- 基尼系数 _原创精品文档.pdf
- 基于马赫增德尔调制器的瞬态脉冲电信号光纤传输系统.pdf
- 基于项目式学习的初中生物课堂教学探析.pdf
- 基于项目化学习的整本书阅读策略探究——以《经典常谈》阅读指导为例.pdf
- 基于行空板虚拟语音助手的设计与实现.pdf
- 基于职业能力评价模型的人体运动学教学改革实践 .pdf
- 基于科学思维生长的小学科学课堂初探—以《光的传播方向会发生改变吗.pdf
- 基于白光LED的照明灯具功能研究 .pdf
- 基于特征光流与在线集成学习的视频目标跟踪方法 .pdf
- 基于游戏化教学的小学数学案例设计与实践.pdf
- 政治丨安徽省卓越县中联盟2025届高三下学期5月检测试卷及答案.pdf
- 政治试卷+答案【河南卷】河南省安阳市、新乡市天一大联考2025届高三年级第三次模拟考试(安阳新乡三模)(5.6-5.8).pdf
- 化学丨山东省九五高中协作体2025高三下学期5月质量试卷及答案.pdf
- 英语丨安徽省鼎尖名校联盟2025届高三下学期5月预测联考试卷及答案.pdf
- 化学丨山东省菏泽市2025届高三下学期5月二模试卷及答案.pdf
- 历史丨山东省临沂市2025届高三下学期5月二模试卷及答案.pdf
- 数学丨安徽省鼎尖名校联盟2025届高三下学期5月预测联考试卷及答案.pdf
- 数学丨山东省菏泽市2025届高三下学期5月二模试卷及答案.pdf
- 数学丨浙江省Z20联盟(浙江省名校新高考研究联盟)2025届高三下学期5月第三次联考试卷及答案.pdf
- 政治丨河南省2025届高三下学期5月考前适应性大联考试卷及答案.pdf
文档评论(0)