数据挖掘实验报告(参考)课件.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列的模型法和数据挖掘两种方法比较分析研究 实验目的 : 通过实验能对时间序列的模型法和数据挖掘两种方法的原理和优缺点有更清楚 的认识和比较 . 实验内容 : 选用 1952-2006 年的中国 GDP,分别对之用自回归移动平均模型 (ARIMA) 和时序 模型的数据挖掘方法进行分析和预测 ,并对两种方法的趋势和预测结果进行比较 并给出解释 . 实验数据 : 本文研究选用 1952-2006 年的中国 GDP,其资料如下 日期 国内生产总值 (亿元 ) 日期 国内生产总值 (亿元 ) 2006-12-31 209407 1997-12-31 74772 2005-12-31 183085 1996-12-31 68593.8 2004-12-31 136515 1995-12-31 58478.1 2003-12-31 116898.4 1994-12-31 45005.8 2002-12-31 105172.3 1993-12-31 34634.4 2001-12-31 97314.8 1992-12-31 26638.1 2000-12-31 89404 1991-12-31 21617.8 1999-12-31 82054 1990-12-31 18547.9 1998-12-31 79553 1989-12-31 16909.2 1988-12-31 14928.3 1969-12-31 1937.9 1987-12-31 11962.5 1968-12-31 1723.1 1986-12-31 10202.2 1967-12-31 1773.9 1985-12-31 8964.4 1966-12-31 1868 1984-12-31 7171 1965-12-31 1716.1 1983-12-31 5934.5 1964-12-31 1454 1982-12-31 5294.7 1963-12-31 1233.3 1981-12-31 4862.4 1962-12-31 1149.3 1980-12-31 4517.8 1961-12-31 1220 1979-12-31 4038.2 1960-12-31 1457 1978-12-31 3624.1 1959-12-31 1439 1977-12-31 3201.9 1958-12-31 1307 1976-12-31 2943.7 1957-12-31 1068 1975-12-31 2997.3 1956-12-31 1028 1974-12-31 2789.9 1955-12-31 910 1973-12-31 2720.9 1954-12-31 859 1972-12-31 2518.1 1953-12-31 824 1971-12-31 2426.4 1952-12-31 679 1970-12-31 2252.7 表一 国内生产总值 (GDP)是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果。 这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中为评价和衡 量国家经济状况、 经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度, 可以说, 它是影响经济生活乃至社会生活的最重要的经济指标。 对其进行的分析预测具有重要的理论 与现实意义。 实验步骤 : 1. 选用 1952 年到 2001 年这 50 个数据参与自回归移动平均模型 (ARIMA) 建模 (所用的工具 是 Eviews). 根据博克斯 -詹金斯提出的建模思想 ,具体步骤为 : (1) 对原序列进行平稳性检验。在以年份为横轴,以山东省 GDP 为纵轴的坐标系中作曲线 图如图 1 所示。 图一 从图 1 中可以看出全国的 GDP 不具有明显的周期变化和季节波动,但呈现出明显的增长趋 势,他的相关系数和偏相关系数如图二所示 图二 从图二中可以看到, 他的自相关系数是拖尾的, 而偏相关系数是截尾的。 对样本数据用 ADF 进行单位根检验的到结果如图三 图三 这里 ADF 值大于三个不同检验水平下的临界值, 故而可以判断出, 我国 GDP 序列是非平稳 的。这就需要对 GDP 序列进行差分以使序列变得平稳。由图一可以看出, GDP 序列明显带 有指数性质,因此现对该序列进行对数变换在 eviews 中输入 genr lngdp=ln(gdp) 生成新的序 列 lngdp,并对新序列进行平稳性检验。 Lngdp 的相关系数和偏相关系数如图四所示, 图四 对 lngdp 用 ADF 进行单位根检验的结果如图五 图五 这里 lngdp 的 ADF 变成了 1.251,依然大于三种不同检验水平下的临界值。从中可以看出, 对 GDP 序列进行对数处理后,序列 lngdp 序

文档评论(0)

liuxiaoyu99 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档