网站大量收购独家精品文档,联系QQ:2885784924

工业多元时序数据质量管理方法研究.pdfVIP

工业多元时序数据质量管理方法研究.pdf

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

工业多元时序数据质量管理方法研究

摘要

数据作为企业提高自身核心竞争力的宝贵资产,是推动创新和优化决策的关键驱动。

在工业4.0时代,工业数据量的爆炸式增长不仅凸显了数据质量问题,也带来了一系列

负面影响。工业多元时序数据质量管理的研究,不仅能够为工业数据质量管理提供理论

基础和实践指导,推动工业制造业的智能化,还能够帮助企业提高生产效率、减少错误

决策和资源浪费。本文聚焦工业传感器定期采集的时间序列数据,涉及多个可能相互关

联的属性。这种多元性代表了数据管理需要考虑各属性间的相互作用,以揭示更深层次

的模式和趋势。然而,现有的工业多元时序数据质量研究并未考虑这些联系。此外,现

有研究还缺乏包含数据采集、评估、清洗等环节的细致化实施方案,通常仅从特定数据

质量维度的基本定义出发进行数据质量评估,并且在数据清洗过程中忽视了各维度重要

性。针对上述问题,本文主要做了如下研究工作:

首先,对工业多元时序数据进行分析,总结目前数据采集中存在的问题,概括工业

数据的特征与挑战,阐述低质量数据引发的负面影响。本文以实现数据的高效管理为出

发点,建立了一个完整的工业多元时序数据质量管理框架,为全文奠定理论基础。

其次,为获取数据集质量状况,本文提出了一个工业多元时序数据质量评估方法。

利用数据剖析技术提取数据集统计信息,细粒度划分完整性、规范性、一致性、及时性、

唯一性、准确性等数据质量维度,考虑同一维度内或不同维度间各子维度的相关性以确

定其度量。通过对各子维度分配权重,充分挖掘数据质量维度深层次信息,以获得反映

数据质量详情的评估结果。在两个数据集上进行实验并与其他方法评估相对比,证明所

提评估方法能更全面的评估数据质量,评估结果能更客观准确的反映数据质量问题。

最后,针对数据集中已知的各数据质量维度问题,本文提出了一个基于改进层次分

析法的数据清洗方法。结合评估过程所得数据质量信息,按照各维度在清洗任务中的重

要性进行优先级排序,并依据实际需求有选择性的执行清洗工作。本文详细讨论了各类

清洗算法的区别,为清洗算法的选择提供了参考依据。在已评估数据集上进行清洗实验

和真实数据集进行对比实验,证明所提清洗方法能够稳定有效的提升数据质量。相比于

其他只能解决特定数据质量问题的清洗方法,本文所提清洗算法能够全方面地清洗各种

问题数据,具有良好的灵活性和可扩展性。

关键词:工业多元时序数据;数据质量;数据质量管理;数据质量评估;数据清洗

工业多元时序数据质量管理方法研究

Abstract

Asavaluableassetforenterprisestoimprovetheircorecompetitiveness,dataisakey

driverforinnovationandoptimizeddecision-making.IntheeraofIndustry4.0,theexplosive

growthofindustrialdatavolumenotonlyhighlightstheproblemofdataquality,butalsobrings

aseriesofnegativeeffects.Theresearchonindustrialmultivariatetimeseriesdataquality

managementcannotonlyprovideatheoreticalbasisandpracticalguidanceforindustrialdata

qualitymanagementandpromotetheintelligenceofindustrialmanufacturing,butalsohelp

enterprisestoimproveproductionefficiency,reducewrongdecisionsandwasteofresources.

T

文档评论(0)

n1u。 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档