高教社2024财经大数据分析—以Python为工具教学课件ch09-使用ARIMA模型预测股票价格——时间序列.pptx

高教社2024财经大数据分析—以Python为工具教学课件ch09-使用ARIMA模型预测股票价格——时间序列.pptx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;;时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,其实质是反映某个或者某些随机变量随时间不断变化的趋势。常见的时间序列如按秒或分钟更新的股价数据、按天更新的利率数据、按月更新的征信数据以及按年更新的宏观经济数据等。;datetime模块是Python处理日期和时间的标准库,提供多种处理日期、时间相关的类。不仅支持日期和时间的算法,也能实现有效的属性提取和格式输出,本部分将介绍使用datetime创建时间对象、查看时间对象属性和转换时间格式等方法。;在日常数据分析中,最为常用的是datetime模块的datetime类,因此我们主要介绍datetime类。;;时间序列的缺失值处理一般采用插值方法,使用缺失值周围的两个已知数据点估计丢失的数据点。较为常见的插值方法有基于时间的插值、样条插值和线性插值,一般通过pandas模块的interpolate()函数来实现。;移动是指沿着时间轴将数据前移或后移,在财经金融数据处理中,时常会用到时间滞后。时间滞后是将t期的数据转换为(t-n)期的数据,可以通过shift()函数实现。;第九章数据分组介绍了groupby()函数,其主要作用是进行数据的分组以及分组后的组内运算,常与agg()和apply()函数搭配使用。这一函数在时间序列数据中也十分常用,同样对时间序列进行分组,之后再进行组内运算,从而获取所需的数据或观察不同组别间的差异。;时间序列通常由趋势、周期性、季节性、误差构成,其中最经常被分析的是趋势和季节性。时间序列可以被看作是趋势、季节性和误差项的整合,其各个观测值可以是以上成分相加或相乘得到的。;时间序列的分解可以通过statsmodels模块的seasonal_decompose来实现。;?;在了解时间序列数据之后,我们可以对其进行简单的分析,比如进行描述性统计。这里我们沿用上节数据,基于前序章节内容,可以直接使用describe()函数查看数据的均值方差等。;;研究不同变量之间的相关性,是为了揭示变量之间的因果关系,以更好地预测目标变量,而时间序列的自相关性同样也是研究和利用时间序列的重要性质。所谓“历史可以重演”,即希望找到时间??列所具有的可延续性特征,以帮助我们更好地预测未来。

时间序列的自相关性可以通过自协方差、自相关系数等统计量来体现。;Python中statsmodels模块包含的acf()函数可以便捷计算自相关系数。;时间序列的平稳性是时间序列研究的基本前提,通过前一节的介绍,我们希望通过自相关性找到时间序列的可延续性特征,并在预测未来时利用该特征,而时间序列的平稳性则是决定该特征能否延续到未来的重要性质。;增广迪基·富勒检验(ADF检验)是最常用的单位根检验方法,Python中的arch模块提供了ADF()函数帮助我们便捷地进行ADF检验。;KPSS检验可以用于趋势平稳性检验,Python中的statsmodels模块提供了kpss()函数帮助我们便捷地进行KPSS检验。;白噪声序列是指序列中任意两个时间点的变量均不相关,序列均值为0、方差为常数,这使得白噪声序列符合平稳时间序列的条件。白噪声序列中没有任何规律,不能用于预测和推断,所以发现一个时间序列为白噪声序列时,说明该时间序列已经失去了继续研究的意义。;可以通过Ljung-Box检验该序列是否为白噪声序列,Python中statsmodels模块提供了q_stat()完成该检验。;;ARIMA(AutoregressiveIntegratedMovingAverage)模型是一种广泛使用的时间序列分析方法,它可以用于对未来的数据进行预测。ARIMA模型由自回归模型(AR模型)、差分整合模型(I模型)和移动平均模型(MA模型)组成,因此也被称为ARIMA(p,d,q)模型。其中,p表示自回归阶数,d表示差分阶数,q表示移动平均阶数。

尝试使用ARIMA模型,对贵州茅台股票价格进行预测分析。

您可能关注的文档

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档