网站大量收购闲置独家精品文档,联系QQ:2885784924

能源大数据分析理论与实践 课件 11.油气大数据分析案例.pptx

能源大数据分析理论与实践 课件 11.油气大数据分析案例.pptx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

油气大数据分析案例11TheCaseofOilandGasBigData

11.1油气消费量的影响因素分析石油和天然气是经济发展的重要驱动因素,分析油气消费量的影响因素和影响效果对政府决策具有重要意义。影响油气消费量的因素较多,本案例选取经济发展、经济结构、科技发展及人口规模4种因素,研究其对油气消费量的影响,从而介绍回归分析的应用方法。其中,油气消费量用符号OGC表示;经济发展使用GDP指标量化,用符号ED表示;经济结构使用第三产业产值占GDP比值来量化,用符号ES表示;科技发展通过研究与试验发展经费支出来量化,用符号TD表示;人口规模使用年末总人口数来量化,用符号PS表示。1.案例描述

11.1油气消费量的影响因素分析2.回归分析(1)数据采集与处理本案例以2001年—2020年全国数据为例,探究各因素对油气消费量的影响,数据来源于《中国统计年鉴》。采集数据之后,需要将数据文件保存为CSV文件,图1部分数据

11.1油气消费量的影响因素分析2.回归分析(2)绘制散点图观察变量关系首先使用pandas库读取数据,使用前需要提前导入这个库。案例中使用的数据文件名是“Oil_and_gas.csv”,然后使用read_csv()函数读取数据文件中的数据,并用第一列作为每一行的索引。绘制自变量与目标变量之间的散点图,即OGC关于ED、OGC关于ES、OGC关于TD、OGC关于PS的散点图。Matplotlib库是用于绘制可视化图像的2D绘图库,该部分使用Matplotlib库的子库matplotlib.pyplot,直接调用plot()函数对列表数据画图。plot()函数默认为绘制线形(kind=line)图形,绘制散点图需要kind=scatter,设置好“x”和“y”等内容,最终使用show()函数进行展示。

11.1油气消费量的影响因素分析2.回归分析importpandasaspdimportmatplotlib.pyplotaspltfilename=Oil_and_gas.csvdata=pd.read_csv(filename,index_col=0)data.plot(kind=scatter,x=ED,y=OGC,title=ED-OGC)plt.xlabel(ED)plt.ylabel(OGC)plt.show()data.plot(kind=scatter,x=ES,y=OGC,title=ES-OGC)plt.xlabel(ES)plt.ylabel(OGC)plt.show()data.plot(kind=scatter,x=TD,y=OGC,title=TD-OGC)plt.xlabel(TD)plt.ylabel(OGC)plt.show()data.plot(kind=scatter,x=PS,y=OGC,title=PS-OGC)plt.xlabel(PS)plt.ylabel(OGC)plt.show()图2散点图绘制结果散点图绘制结果如图所示,该模型所选择的4个自变量均与目标变量存在线性相关关系,可以尝试使用线性回归方法进行估计。

11.1油气消费量的影响因素分析2.回归分析(3)回归分析模型应用建立回归分析模型可以使用statsmodels库,它是Python中的统计分析库,提供了多种用于统计建模和分析的函数和类,用于拟合多种统计模型,执行统计测试及数据探索和可视化。首先使用iloc()函数定位数据所在列,并将数据类型转换成浮点型;然后使用sm.add_constant()函数在“X”上加入一列常数项,从而得出后续的常数项;接着使用OLS()函数建立模型,使用fit()函数获取拟合结果,最后使用summary()函数展示拟合模型的详细结果。importstatsmodels.apiassmX=data.iloc[:,1:5].values.astype(float)y=data.iloc[:,0].values.astype(float)X=sm.add_constant(X)model=sm.OLS(y,X)results=model.fit()print(检验的结果为:\n,results.summary())

11.1油气消费量的影响因素分析3.结果分析可以通过程序输出结果观察我国油气消费量与影响因素之间的关系,在回归分析模型中,R2为0.998,表明模型的拟合度较好,自变量经济发展(ED)的回归系数为0.0207,P值为0.446,说明经济发展对油气消费量有正向促进作用,但显著性不高;经济结构(ES)的回归系数为-0.6158,P值为0.104,虽未低于0.1,但基本说

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档