基于大数据的大气监测研究.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

基于大数据的大气监测研究

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

曾羽琚

摘要:该文针对在大气环境监测中大数据应用情况和存在的问题,分析了大数据应用的基本原理和当前现状,同时提出了优化控制的方法策略,为后续大数据应用于大气监测深化研究提供依据。

关键词:大气环境监测;大数据;PM2.5

中图分类号:TP311文献标识码:A文章编号:1009-3044(2018)07-0015-02

当前我国已经进入物联网新时代,每时每刻每行每业都会不断产生着海量的各类数据。无法在一定时间范围内用常规软件工具进行捕捉、管理和处理这些数据集合。因此,通过新处理模式研发各种大量基础和应用软件的,使得数据计算与数据处理更加完善和丰富,同时在数据信息的储存、运算等功能得到加强。为了具有更强的决策力、洞察发现力和流程优化能力来处理这些海量、高增长率和多样化的信息资源。大数据解析技术在实践生活中的使用,能够充分提高信息采集、数据计算、实际模拟以及各类数据识别等数据操作性工作的效率,能够极大提高环境保护工作的质量和效率。那么根据实际工作环境监测中应用大数据解析技术为例,来分析大数据应用的得与失[1]。

1大数据技术在PM2.5大气监测中原理及现实情况

当前,全国性大范围长时间的大气PM2.5污染问题,给大众的生活和健康带来重大威胁。空气监测网不健全,覆盖范围不全面,密度低,追踪预警能力低。从全国范围来看,平时常规使用连续自动监测法下的β射线法和震荡天平法对PM2.5进行测量。但是,每个城市无法在多个区域建设大气自动监测站,以便连续稳定获取数据。所以在时间点上的获取的数据就缺乏完整性和代表性。那么解决这个困境的最佳方法就是,加大对大数据解析能力的研究,找出优化控制的方法策略[3]。常见的方法策略主要是:数据采集功能、统计计算、随机过程分析、系统模拟与参数识别等功能。也就是通过解析多元和非线性数据类之间的关系,掌握目标函数的变化规律[4],为控制PM2.5污染提供数据参考。

具体来说,大数据分析技术应用于PM2.5的难点主要是需要处理复杂数据类的关联关系。同时还需要在数据分析过程中对问题进行条理化和简化处理。因此根据以上原则,我们主要做了如下工作:

1)在应用大数据解析技术时,需要有明确科研对象与科研内容。本次研究确定研究对象为湖南省长沙市雨花区,以城市局部地区分布的PM2.5平均浓度作为研究内容。

2)将目标区域按照一定的标准进行网格划分,本次研究划分为500m×500m。因此雨花区这个研究对象可以表达为M=(m1,m2,…,mi,…,mn),其中每个mi均代表一个范围0.25km2的地点;而研究内容表達为D=(Dm1,Dm2,…,Dmi,…,Dmn),其中,Dmi表示为mi网格的PM2.5浓度。最终研究内容,通过大数据解析技术应用控制的目标函数,即可表示为:D(Mi)。

3)可将目标函数按照PM2.5监测的实际情况分化:一种是PM2.5自动监[本文来自于Www.zZ-new.Com]测站网格和另外一种是非PM2.5自动监测站网格,非PM2.5自动监测站网格数据是大数据解析技术需要解决的目标数据[5]。大气环境监测中应用的大数据解析技术,能够将各种数据充分融合,能够提高数据处理效率。

2大数据技术在PM2.5大气监测中主要关键点

湖南省长沙市雨花区每日进行的大气PM2.5监测,首先要解决和完善的问题就是:获取正确的数据类及选择适应特征量。对于数据类的要求是需要获得与目标函数一定相关性的数据类,以便更加精确掌握未设置PM2.5自动监测站网络的环境现状。该数据类与目标函数的关联性不定可以简洁也可以复杂,同时数据类的内部的相关性即各个不同数据类之间可强也可弱。与大气PM2.5监测相关的数据类主要包括:历史PM2.5浓度数据;历史的气压数据;网格内部道路现状数据;网格内与空气污染有关的数据,工厂排放数据、加油站挥发数据、餐饮业排放数据、公园树木净化能力等数据[5]。

目标函数主要是受到数据类的影响,特征量与目标函数呈现正相关。这就需要从复杂数据类中提取有益特征量,以方便更加快速获取数据类。例如,当需要获取清晨5时,目标内网格PM2.5小时平均浓度。当前已知数据是监测点内每两小时的网格PM2.5浓度数据,所以我们需要将之前监测点内PM2.5每两小时平均浓度作为特征量;在明确了所需要的特征量后,通过公式结合已知数据类可以获取目标函数的值,即目标数据类。

这里的计算公式为:

[M(f+I)j=Mfj+V(f+I)j]

[V(f+1)j=ht*Vf+bc*qd*Pdxj-Xij+bc2*rd*(MGdxj-Xfj)]

其中,j=1,2,……d;bc和bc2为加速参数,都是非负常数,本文选定为3;qd为介于[0,1

文档评论(0)

134****9594 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档