网站大量收购闲置独家精品文档,联系QQ:2885784924

能源大数据分析理论与实践 课件 12.电力大数据分析.pptx

能源大数据分析理论与实践 课件 12.电力大数据分析.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

电力大数据分析12E-PowerBigDataAnalysis

12.1基于LSTM方法的家庭用电量预测案例数据集来自UCI机器学习数据集,该数据集包含了2006年12月16日至2010年11月26日期间收集的1000个测量值,部分数据集如图所示。数据集中的特征信息如下。(1)Date:日期,格式为dd/mm/yyyy。(2)Time:时间,格式为hh:mm:ss。(3)Global_active_power:全球每分钟消耗的家用平均有功功率(千瓦)。(4)Global_reactive_power:全球每分钟消耗的家用平均无功功率(千瓦)。(5)Voltage:每分钟平均电压(伏特)。(6)Global_intensity:全球每分钟的家用平均电流强度(安培)。

12.1基于LSTM方法的家庭用电量预测(7)Sub_metering_1:1号能量子计量(以瓦时为单位的有功能量),主要是指厨房中的洗碗机、烤箱和微波炉消耗的电量。(8)Sub_metering_2:2号能量子计量(以瓦时为单位的有功能量),主要是指洗衣房中洗衣机、烘干机等消耗的电量。(9)Sub_metering_3:3号能量子计量(以瓦时为单位的有功能量),主要是指电热水器和空调消耗的电量。

12.1基于LSTM方法的家庭用电量预测1)数据的导入与预处理数据集包含一些缺失值(约占行数的1.25%),数据集中存在所有日历时间戳,但对于某些时间戳,缺少测量值,因此需要对数据进行预处理。在进行数据预处理之前,导入所需的数据,该数据集包含2075259行和7列的数据。首先对缺失数据进行检查,查看各列缺失数据的情况并用均值进行填充,以保证数据的统计特性,并提高分析的准确性。代码如下。defETL_data():df=pd.read_csv(household_power_consumption.txt,sep=;,parse_dates={dt:[Date,Time]},low_memory=False,na_values=[nan,?],index_col=dt,dayfirst=True)print(df.shape)print(df.isnull().sum())df=df.fillna(df.mean())print(df.isnull().sum())print(df.corr())returndf

12.1基于LSTM方法的家庭用电量预测2)数据可视化为了进一步理解和分析数据,可以对现有的数据集进行可视化操作,分别绘制各列数据每月、每日、每小时的均值,代码如下。defdata_plot(df):i=1cols=[0,1,3,4,5,6]plt.figure(figsize=(20,10))forcolincols:plt.subplot(len(cols),1,i)plt.plot(df.resample(M).mean().values[:,col])plt.title(df.columns[col]+dataresampleovermonthformean,y=0.75,loc=left)i+=1plt.show()i=1

12.1基于LSTM方法的家庭用电量预测cols=[0,1,3,4,5,6]plt.figure(figsize=(20,10))forcolincols:plt.subplot(len(cols),1,i)plt.plot(df.resample(D).mean().values[:,col])plt.title(df.columns[col]+dataresampleoverdayformean,y=0.75,loc=center)i+=1plt.show()i=1cols=[0,1,3,4,5,6]plt.figure(figsize=(20,10))forcolincols:plt.subplot(len(cols),1,i)plt.plot(df.resample(H).mean().values[:,col])plt.

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档