- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文分类号: 学校代码:10708
2
学 号:1406046
o倏晶科义大拳
or SHAANXI UNIVERSITY OF SCIENCE TECHNOLOGY
硕士学位论文
Thesis for Masters Degree
基于数据挖掘技术的空气质量指数
预测研究
万方数据
基于数据挖掘技术的空气质量指数预测研究
摘
近年来空气污染状况日益严重,频繁出现的重污染天气对人们的日常
生活乃至生命健康都造成了严重影响。空气质量指数(AQI)的预报作为公
众知晓未来空气状况最直接的途径,不仅能为环保部门开展空气环境治理
工作提供指导,同时也能够提醒公众合理规避重度污染天气。但由于影响
空气质量的因素较多,气象环境的复杂性、污染物之间的非线性关系都为
空气质量指数的预报造成了困难。且传统的潜势预报、数值预报也并未做
到对海量历史数据的充分利用,因此在预报中依然存在着准确度不高、实
效性不强等局限性。
针对这些问题,论文以西安市2014年1月28日-2016年8月29日间
空气质量监测站点每日所采集的数据为研究对象,使用数据挖掘技术中的
灰色系统理论以及神经网络技术,建立了两种空气质量指数预测模型。并
通过对模型的进一步优化,提高预测准确度以及结果的可接受度。论文的
主 工作如下:
(1)选择合适的指标数据参与空气质量指数预测模型的建立。指标的
选取应从环境要素以及气象条件两方面考虑。根据环境空气质量标准,选
取SO2、PM2.5 、PM10、CO、。3、NO2 AQI等7项污染指标,以及风力级
别、平均湿度、最高温度、最低温度、平均温度等5项气象因素共计12个
指标作为此次预测建模的主要研究对象。
(2)对参与预测建模的数据进行预处理。首先,需 对监测站点采集
的数据进行初步筛选,在剔除无效和缺失数据后,保留940条数据。其次,
考虑到不同影响因子的数据取值范围以及单位存在明显差异,会对预测结
果产生影响,因此采用mapminmax 函数对数据进行归一化处理,以消除各
类数据之间的量纲差别。
(3)建立基于GM(1,1)的空气质量指数预测模型。根据灰色预测方法
的适用特性,以空气质量指数的历史数据作为研究对象,建立基于
预测模型。通过对预测结果进行分析,评估灰色系统理论在空气质量预测
上的效果。
(4)建立基于BP神经网络的空气质量指数预测模型。根据参与建模
的数据调整BP神经网络的参数,确定合理的网络结构,并在MATLAB平
台下编写完整预测程序,对空气质量指数进行预测。计算结果的平均绝对
万方数据
百分比误差、可接受度以及空气质量等级预测的正确率,以此来评价预测
模型。
(5)对BP神经网络的预测模型进行优化。为进一步提高预测的精确
性,分别使用主成分分析法和遗传算法对BP神经网络的预测模型进行优
化。一方面通过降低输入变量的维度来消除训练过程的复杂度,而另一方
面则是通过优化BP神经网络的初始参数来提高模型的预测能力。最后,将
优化后的PCA-BP、GA-BP神经网络的预测模型与单一 BP神经网络的预测
模型进行对比。
结果表明,在有效信息较少的情况下,灰色预测模型对于空气质量指
数的预测有一定意义。而在数据较丰富的情况下,单一 BP神经网络预测模
型的平均绝对百分比误差为21.96%0在对
文档评论(0)