- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Data Mining: Concepts and Techniques 时间序列及其应用 时间序列(Time Series)挖掘是数据挖掘中的一个重要研究分支,有着广泛的应用价值 。 近年来,时间序列挖掘在宏观的经济预测、市场营销、客流量分析、太阳黑子数、月降水量、河流流量、股票价格变动等众多领域得到应用。事实上,社会、科学、经济、技术等领域中广泛存在着大量的时间序列数据有待进一步的分析和处理。 时间序列数据挖掘通过研究信息的时间特性,深入洞悉事物进化的机制,是获得知识的有效途径。 时间序列有关概念 从统计意义上来讲,所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间先后顺序排列而成的数列。 时间序列挖掘通过对过去历史行为的客观记录分析,揭示其内在规律,进而完成预测未来行为等决策性工作。 简言之,时间序列数据挖掘就是要从大量的时间序列数据中提取人们事先不知道的、但又是潜在有用的与时间属性相关的信息和知识,并用于短期、中期或长期预测,指导人们的社会、经济、军事和生活等行为。 从数学意义上来讲,如果我们对某一过程中的某一变量进行X(t)观察测量,在一系列时刻t1,t2,…,tn(t为自变量,且t1t2…,tn)得到的离散有序数集合Xt1,Xt2,…,Xtn称为离散数字时间序列。设X(t)是一个随机过程,Xti (i=1,2,…,n)称为一次样本实现,也就是一个时间序列。 时间序列有关概念 时间序列的研究必须依据合适的理论和技术进行,时间序列的多样性表明其研究必须结合序列特点来找到合适的建模方法。 一元时间序列:如某种商品的销售量数列等,可以通过单变量随机过程的观察获得规律性信息。 多元时间序列。如包含气温、气压、雨量等在内的天气数据,通过多个变量描述变化规律。时间序列挖掘需要揭示各变量间相互依存关系的动态规律性。 离散型时间序列:如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列。 连续型时间序列:如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。 序列的分布规律:序列的统计特征可以表现平稳或者有规律的震荡,这样的序列是分析的基础点。此外如果序列按某类规律(如高斯型)分布,那么序列的分析就有了理论根据。 时间序列预测的常用方法 时间序列分析的一个重要应用是预测,即根据已知时间序列中数据的变化特征和趋势,预测未来属性值。为了对时间序列预测方法有一个比较全面的了解,我们首先对时间序列预测的主要方法加以归纳。 确定性时间序列预测方法 随机时间序列预测方法 其他方法 时间序列预测的常用方法(续) 确定性时间序列预测方法 对于平稳变化特征的时间序列来说,假设未来行为与现在的行为有关,利用属性现在的值预测将来的值是可行的。例如,要预测下周某种商品的销售额,可以用最近一段时间的实际销售量来建立预测模型。 一种更科学的评价时间序列变动的方法是将变化在多维上加以综合考虑,把数据的变动看成是长期趋势、季节变动和随机型变动共同作用的结果。 长期趋势:随时间变化的、按照某种规则稳步增长、下降或保持在某一水平上的规律。 季节变动:在一定时间内(如一年)的周期性变化规律(如冬季羽绒服销售增加)。 随机型变动:不可控的偶然因素等。 设Tt表示长期趋势,St 表示季节变动趋势项,Ct 表示循环变动趋势项,Rt表示随机干扰项,yt 是观测目标的观测记录。则常见的确定性时间序列模型有以下几种类型: 加法模型:yt = Tt + St + Ct + Rt。 乘法模型:yt = Tt·St·Ct·Rt。 混合模型:yt = Tt·St + Rt 或yt = St + Tt·Ct·Rt。 时间序列预测的常用方法(续) 随机时间序列预测方法 通过建立随机模型,对随机时间序列进行分析,可以预测未来值。 若时间序列是平稳的,可以用自回归(Auto Regressive,简称AR)模型、移动回归模型(Moving Average,简称MA)或自回归移动平均(Auto Regressive Moving Average,简称ARMA)模型进行分析预测。 其他方法 可用于时间序列预测的方法很多,其中比较成功的是神经网络。由于大量的时间序列是非平稳的,因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练,通过数学统计模型估计神经网络的各层权重参数初值,就可能建立神经网络预测模型,用于时间序列的预测。 基于ARMA模型的序列匹配方法 ARMA模型(特别是其中的AR模型)是时序方法中最基本的、实际应用最广的时序模型。早在1927年,G. U. Yule就提出了AR模型,此后,AR模型逐步发展为ARM
文档评论(0)