时间序列分析方法及R语言实现-12.docx

时间序列分析方法及R语言实现-12.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列分析方法及R语言实现 1.1时间序列分析概述 时间序列是将某种统计指标的数值,按时间先后顺序排到所形成的数列。时间序列分析就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平。在食品安全领域,时间序列分析可用于预测食源性疾病的发病率,实现食源性疾病的暴发预警;用于预测食品抽检合格率,实现食品质量安全的预警。 时间序列分析的前提是假定事物的过去延续到未来。这个假设前提包含两层含义:一是不会发生突然的跳跃变化,是以相对小的步伐前进;二是过去和当前的现象可能表明现在和将来活动的发展变化趋向。这就决定了在一般情况下,时间序列分析法对于短、近期预测比较显著,但如延伸到更远的将来,就会出现很大的局限性,导致预测值偏离实际较大而使决策失误。 时间序列数据变动存在着规律性与不规律性。时间序列中的每个观察值大小,是影响变化的各种不同因素在同一时刻发生作用的综合结果。从这些影响因素发生作用的大小和方向变化的时间特性来看,这些因素造成的时间序列数据的变动分为四种类型。 (1) 季节性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。 (2) 趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不相等。 (3)随机性:个别为随机变动,整体呈统计规律。 (4)综合性:实际变化情况是几种变动的叠加或组合。预测时设法过滤除去不规则变动,突出反映趋势性和周期性变动。 图表5-1是某省2010-2015年伤寒时间序列分解图,从上而下分别展示了伤寒序列的综合性、周期性、趋势性和随机性。由图可以看出,时间序列没有上升趋势,但有一定的季节性,即夏季高,冬季低。 图表5-1 某省伤寒的时间序列分解图 library(tseries) d = read.csv(伤寒.csv,header = F) p=unlist(d) pt=ts(p,frequency=12,start=2010) 1.2平稳序列建模 平稳性是时间序列分析中很重要的一个概念。一般的时间序列若是平稳的,需要同时满足一下两个条件: 1)均值函数是一个常数函数。 2)自协方差函数只与时滞有关,与时间点无关。 证明序列是否为平稳序列有两种方法,一种就是的观察时序图,平稳序列的时序图一般是会在某个常数值附近随机波动,而且波动的范围有边界。,另一种是ADF单位根检验,其原假设为序列是非平稳的。示例:图表5-2的ADF检验结果,p值小于0.05,所以拒绝原假设,选择备择假设,即此时序列是平稳的。 图表5-2 某省2010-2015年伤寒序列ADF单位根平稳性检验结果 adf.test(d) 目前平稳时间序列常用的是自回归移动平均模型(auto regression moving average),简称ARMA(p,q),其中AR是自回归,p为其自回归项数;MA为移动平均,q为其移动平均项数。ARMA模型又细分为AR模型(auto regression model)、MA模型(moving average model)和ARMA模型(auto regression moving average model)三大类。 1.2.1 AR模型 AR是自回归模型,就是用自身做回归变量,即用过去各期的观测值来预测当前期的值,方程可写成: 其中,序列Yt-p为前p期的的观测值,εt是序列在t期无法用过去解释的新信息,每一期都独立于观测值。由方程可看出,Yt的观测值是自身近p阶滞后项和新息项εt的线性组合。 1.2.2 MA模型 MA模型,就是用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值,方程表示为: Yt是由1,-θ1,-θ2,-θ3,……,-θq,为εt,εt-1,εt-2,……,εt-q的权数平均得到,权数移动至εt+1,εt,εt-1,……,εt-q+1得到Yt+1,依次向前移动求出预测值。εt,εt-1,εt-2,εt-3,……,εt-q为白噪声序列,记为{εt }。 白噪声序列需满足三个条件: 1.E(et)=0 2.Var(et)=a^2 3.Cov(et,es)=0 (其中t不等于s) 即该序列均值为0,方差为常数,协方差为0,是纯随机序列。一个序列如果是纯随机的,就意味着它每一次新的变化都无迹可寻,从中挖掘不出对预测有益的信息。一旦发现某个序列是纯随机序列,说明这个序列已经没有什么可以挖掘的有用信息,因而可以停止对它分析。通常可以用Ljung-Box检验,简称LB检验,LB检验的原假设是所检验的序列是纯随机序列。示例:图表5-4对伤寒序列做LB检验,发现p值小于0.05,说明该序列不是白噪声序列,可以进一步提取序列中的信息。

文档评论(0)

祝星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档