Python数据分析与数据挖掘第9章数据分析.ppt

下载文档

28
0
约2.14万字
约 54页
2023-01-26 发布于甘肃
举报
版权申诉
保障服务

Python数据分析与数据挖掘第9章数据分析.ppt

1、本文档共54页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

周期性差分自回归移动平均模型(SARIMAX) # 外推 n = 30 extrap = sarimax.get_forecast(n) #构建预测与外推对象实例 df_extrap = extrap.conf_int(alpha = 0.05) #置信水平95% df_extrap.index = pd.date_range(X.index[-1], periods=n, freq=b) df_extrap[extrap] = sarimax.predict( start=X.shape[-1], end=X.shape[-1]+n-1).values 向量自回归模型（VAR） statsmodels.tsa.vector_ar.var_model.VAR(endog, exog=None, dates=None, freq=None, missing=none) 例如，对于前例中的股票交易数据（其中包括收盘价Close、最高价High、最低价Low、开盘价Open和成交量Volume），进行向量回归处理和预测，可以得到如图所示的结果。图中较为分离的曲线为成交量Volume数据，数值以右侧坐标轴标注。 statsmodels_VAR.py 向量自回归滑动平均模型(VARMA) statsmodels.tsa.statespace.varmax.VARMAX(endog, exog=None, order=(1, 0), trend=c, error_cov_type=unstructured, measurement_error=False, enforce_stationarity=True, enforce_invertibility=True, trend_offset=1, **kwargs) 向量自回归滑动平均模型VARMA (Vector Autoregression Moving-Average)，是ARMA对多个并行时间序列的推广。应用时，使用VARMAX(VARMA with Exogenous)，包括外生变量的建模。数据透视表pivot_table # 读入数据 df = pd.read_csv(pivot_data.csv, engine=python) # 统计分析主客场胜负情况 pivot1 = pd.pivot_table(df, values=[对手], aggfunc=count, index=[主客场,胜负], observed=True) # 分析主客场、不同胜负情况下，投篮数、命中、和得分三项指标的情况 pivot2 = pd.pivot_table(df, values=[投篮数,命中,得分], index=[主客场,胜负], aggfunc=[np.sum,np.mean], margins=True, margins_name=总计) # 分析与不同对手比赛，不同胜负情况下，主客场时，助攻、得分、和篮板三项指标的情况 pivot3 = pd.pivot_table(df, index=[u对手,u胜负], columns=[u主客场], values=[得分,助攻,篮板], aggfunc=[np.mean], fill_value=0) 9.1.3 参数估计与假设检验正态性检验方差齐次检验 T检验 F检验卡方检验概率密度函数估计正态性检验 scipy.stats.kstest(rvs, cdf, args=(), N=20, alternative=two-sided, mode=auto) import numpy as np from scipy.stats import kstest, norm np.random.seed(1234) ks_res = kstest(np.random.normal(loc=5, scale=3.0, size=(500,)), cdf=norm.cdf, args=(5, 3.0)) print(ks_res) KstestResult(statistic=0.028471332239411007, pvalue=0.801391977936581) 方差齐次检验 scipy.stats.levene(sample1, sample2, ..., center=median, proportiontocut =

您可能关注的文档

文档评论（0）

dllkxy + 关注: 实名认证

内容提供者

本文库主要涉及建筑、教育等资料，有问题可以联系解决哦

咨询Ta 进入空间

用户编号：5213302032000001

1亿VIP精品文档

更多 >

Python数据分析与数据挖掘第9章数据分析.ppt