网站大量收购独家精品文档,联系QQ:2885784924

水文时间序列模体挖掘.pdfVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
水文时间序列模体挖掘.pdf

水 利 学 报 2012年12月 SHUILI XUEBAO 第43卷 第12期 文章编号:0559—9350(2012)12—1422—09 水文时间序列模体挖掘 朱跃龙,彭 力,李士进,冯 钧 (河海大学 计算机与信息学院,江苏 南京 210098) 摘要:水文时间序列数据中蕴藏着自然演变的规律和人类活动对下垫面影响的信息。通过序列模式挖掘技术发 现这些时空序列中蕴藏的洪水频率、水文情势突变等物理规律能够为水文预测预报、防汛调度等提供辅助决策支 持。模体是指在一组序列中重复出现的相似片段模式。时间序列模体数据挖掘就是利用数据挖掘思想,在时间序 列中找出重复出现的相似片段的过程。本文针对水文时间序列的特点以及对洪水和旱情的挖掘需求,提出基于小 波变换、极值点分解和符号化的模体挖掘方法GSB—VLMD(Grammars&Semantics Based—Variable Length M0tifs Dis— covery)。其中小波变换负责对数据去噪,使处理后的数据变得更加平滑;极值点分解负责从平滑数据中提取洪水 和干旱等极值语义信息;符号化负责离散化数据,为模体挖掘Sequitur算法提供输入。以太湖近50年水位序列作 为源数据,使用该方法对其进行模体挖掘,结果证明了其正确性和实用性。 关键词:模体;数据挖掘;水文时间序列;Sequitur;小波变换 中图分类号:P333.6 文献标识码:A 1 研究背景 时间序列挖掘,在2005年国际数据挖掘年会(ICDM2005)上被众多数据挖掘研究专家一致公认为 数据挖掘领域的十大挑战性研究问题之一…。其研究内容一般包括:时间序列相似性有哪些信誉好的足球投注网站、聚类、分 类、序列模式挖掘、海量时间序列可视化、时问序列预测等。模体挖掘 属于序列模式挖掘范畴。 模体是生物学名词,它代表在一组序列中重复出现的相似片段模式。这组序列可以是蛋白质序 列、RNA序列、DNA序列等。时间序列模体数据挖掘就是利用数据挖掘思想,在时间序列中找出重 复出现的相似片段的过程。与传统相似性查找不同,进行模体挖掘前,并不知道重复出现的片段的 具体特性,如长度、出现的位置、频率等。 水文领域积累了大量的观测数据,这些数据中蕴藏着自然演变的规律和人类活动对下垫面影响 的信息。通过序列模式挖掘技术发现这些时空序列中蕴藏的洪水频率/周期、水文情势突变等物理规 律能够为水文预测预报、防汛调度等提供辅助决策支持。 虽然模体数据挖掘技术应用广泛,但在水文领域,尚未见相关研究报道。在水文领域,时间序 列模体数据挖掘具有重要意义。例如,我们可以从水位、流量时间序列中找出重复出现的相似洪灾 或旱情的水文过程进而发现它们的内在规律。除此之外,我们还可能发现一些意想不到的模式,如 洪水和旱情之间前后关联的模式。 自从2002年Lin等 首次提出时间序列模体挖掘概念后,经过近1O年的发展,人们提出了很多算 法 ,但这些算法都有一个共同的缺点:需要用户指定一个表示待发现模体长度的参数,而这个长 度在挖掘前用户很可能不知道或者非常难以确定。直到2010年,Li等 提出的GB—VLMD(Grammar 收稿日期:2Ol1—07—24 基金项目:国家自然科学基金项目;水利部948项目(201016);江苏省科技支撑计划(BE2012179) 作者简介:朱跃龙(1959一),男,江苏建湖人,博士,教授,主要从事水信息学,智能信息处理研究。E—mail:vlzhu@hhu.edu.cn 通讯作者:李士进(1973一),男,江苏姜堰人,博士,教授,主要从事模式识别,数据挖掘研究。E-mail:lishijin@hhu.edu.cn 一 1422— Based—Variable Length Motif Discovery)模体挖掘算法改变了这一局面。该算法最大的特点是不需要指 定模体长度参数便可以在只遍历一次数据的情况下,挖掘出不同长度的模体。本文提出的方法就是 在该方法基础上发展而来。以下首先介绍该文中的算法,然后对其在水文时间序列模体挖掘时存在 的问题加以改进。 2 模体挖掘算法分析 2.1 相关研究 模体数据挖掘(

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档