Python数据分析与数据挖掘 第9章 数据分析.ppt

Python数据分析与数据挖掘 第9章 数据分析.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
周期性差分自回归移动平均模型(SARIMAX) # 外推 n = 30 extrap = sarimax.get_forecast(n) #构建预测与外推对象实例 df_extrap = extrap.conf_int(alpha = 0.05) #置信水平95% df_extrap.index = pd.date_range(X.index[-1], periods=n, freq=b) df_extrap[extrap] = sarimax.predict( start=X.shape[-1], end=X.shape[-1]+n-1).values 向量自回归模型(VAR) statsmodels.tsa.vector_ar.var_model.VAR(endog, exog=None, dates=None, freq=None, missing=none) 例如,对于前例中的股票交易数据(其中包括收盘价Close、最高价High、最低价Low、开盘价Open和成交量Volume),进行向量回归处理和预测,可以得到如图所示的结果。 图中较为分离的曲线为成交量Volume数据,数值以右侧坐标轴标注。 statsmodels_VAR.py 向量自回归滑动平均模型(VARMA) statsmodels.tsa.statespace.varmax.VARMAX(endog, exog=None, order=(1, 0), trend=c, error_cov_type=unstructured, measurement_error=False, enforce_stationarity=True, enforce_invertibility=True, trend_offset=1, **kwargs) 向量自回归滑动平均模型VARMA (Vector Autoregression Moving-Average),是ARMA对多个并行时间序列的推广。应用时,使用VARMAX(VARMA with Exogenous),包括外生变量的建模。 数据透视表pivot_table # 读入数据 df = pd.read_csv(pivot_data.csv, engine=python) # 统计分析主客场胜负情况 pivot1 = pd.pivot_table(df, values=[对手], aggfunc=count, index=[主客场,胜负], observed=True) # 分析主客场、不同胜负情况下,投篮数、命中、和得分三项指标的情况 pivot2 = pd.pivot_table(df, values=[投篮数,命中,得分], index=[主客场,胜负], aggfunc=[np.sum,np.mean], margins=True, margins_name=总计) # 分析与不同对手比赛,不同胜负情况下,主客场时,助攻、得分、和篮板三项指标的情况 pivot3 = pd.pivot_table(df, index=[u对手,u胜负], columns=[u主客场], values=[得分,助攻,篮板], aggfunc=[np.mean], fill_value=0) 9.1.3 参数估计与假设检验 正态性检验 方差齐次检验 T检验 F检验 卡方检验 概率密度函数估计 正态性检验 scipy.stats.kstest(rvs, cdf, args=(), N=20, alternative=two-sided, mode=auto) import numpy as np from scipy.stats import kstest, norm np.random.seed(1234) ks_res = kstest(np.random.normal(loc=5, scale=3.0, size=(500,)), cdf=norm.cdf, args=(5, 3.0)) print(ks_res) KstestResult(statistic=0.028471332239411007, pvalue=0.801391977936581) 方差齐次检验 scipy.stats.levene(sample1, sample2, ..., center=median, proportiontocut =

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档