基于兴趣度关联规则的海洋气象数据质控算法.docx

基于兴趣度关联规则的海洋气象数据质控算法.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于兴趣度关联规则的海洋气象数据质控算法 摘 要: 为了提高海洋漂流浮标观测数据的质量,提出一种新的基于兴趣度模型的关联规则挖掘算法。通过该关联规则算法挖掘浮标观测数据,提取出所有关联项对形成范例库,以此构建海洋漂流浮标数据质量控制模型,并与传统数据质量控制方法对比,发现基于新的关联规则算法的质量控制模型在检出率和灵敏度以及性能方面有极大提高,非常具有可行性。通过真实数据验证表明,新算法不仅能够挖掘出所有相关性很强的规则,与同类非Apriori类算法相比,在时间性能上更加优越。 关键词: 海洋漂流浮标; 兴趣度; 关联规则; 挖掘算法; 气象数据; 质量控制 中图分类号: TN011?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)22?0138?05 Abstract: A new association rule mining algorithm based on the interestingness model is proposed to improve the observation data quality of the ocean drifting buoy. The association rule algorithm is adopted to mine the buoy observation data, so as to extract all the correlation pairs to form a sample database, based on which the data quality control model of the ocean drifting buoy is constructed. By comparing with the traditional data quality control methods, it is found that the quality control model based on the new association rule algorithm has improved a lot in detection rate, sensitivity and performance, which is of great feasibility. The results of the real data verification show that the new algorithm can mine all rules with strong correlation, and has more superior time performance than other non?Apriori algorithms of the same class. Keywords: ocean drifting buoy; interestingness; association rule; mining algorithm; meteorological data; quality control 海洋漂流浮标凭借自身体积小、重量轻、便于投放等一系列特点成为海洋水文观测的重要工具之一。为了确保观测数据的准确性和实用性,对获取的海量观测数据进行科学有效的质量控制必不可少。一般而言,漂流浮标数据的质控内容有时间一致性质控、位置质控、梯度质控、极值控制等。其核心内容是对观测数据中异常值的质控。海洋数据中异常值的检测常抽象为离群数据的有哪些信誉好的足球投注网站和聚类[1]。关于时间序列异常值的判定,比较常用且具有共性特征的是基于经典统计理论的离群点检测方法[2]。该检测方法对单个异常点判断比较准确。而异常值常以连续多个的复杂方式出现,甚至在小段时间内可能超过正常数据的量。因此,基于统计理论的海洋数据异常值检测法很难对这些数据进行有效的判断。海洋观测数据种类多,而对不同类型的异常值判断没有一种普适性的异常检测方法。虽然在海洋数据质量控制方法存在大量的研究成果,但是内容主要围绕质控共性理论方法进行研究[3?4]。应用于浮标数据且具有可行性的质控方法流程比较少见。 本文从关联规则在孤立点分析和异常检测中[5?6]的应用出发,结合气象观测数据的特点以及误差等背景,提出基于关联规则的海洋浮标气象观测数据的质量控制模型。接着从相关性角度出发提出一种新的基于兴趣度的关联规则挖掘算法,通过项或项对的超集的兴趣度上界来裁剪有哪些信誉好的足球投注网站空间[7],不仅避免了传统关联规则挖掘算法的不足,而且在时间性能上提高更显著。 1 关联规则挖掘算法 2 算法与实验 2.1 算法主要思想 2.3 实验分析 分别在这两组数据集上将本文算法与未使用上界剪枝算法的运行时间做对比。如图1、图2所示,两种算

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档