- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据分析在都市照明管理系统中的应用
作者:李今
来源:《软件导刊》第05期
????????摘要:都市照明监控历史运行数据往往蕴含著大量的潜在信息和知识,人們迫切需要對有价值的数据進行深度挖掘,并将获得的成果应用于运行状况评估、异常预警和运行参数调优中。基于都市照明监控历史运行数据,提出了一种基于大数据分析技术的应用措施,對海量运行数据進行聚类分析,以及對場景模式進行划分得到鉴别决策树,并對实時监测過程中的動态数据進行离群點分析,從而鉴别目前设备运行状况。結合应用实例對模型進行合理性验证,证明了该措施的可行性。
????????关键詞:大数据分析;聚类分析;鉴别决策树;离群點分析
????????中图分类号:TP301
????????文献標识码:A文章编号文章编号:1672-7800()005-0001-04
????????作者简介:李今(1982-),男,上海人,硕士,上海五零盛同信息科技有限企业软件部工程師,研究方向為软件项目管理、软件系统设计与開发。
????????0引言
????????伴随社會的不停進步和计算机技术的迅速发展,信息系统在各领域迅速拓展,系统采集、累积和处理的数据越来越多,信息增速也不停加紧,這也预示著大数据時代已經到来。麦肯锡认為,“大数据”指所波及的数据集规模超過了老式数据库软件获取、存储、管理和分析的能力[1]。
????????虽然現实世界产生的数据量不停增長,但其中可理解的比例却不停下降,人們迫切需要對大数据進行分析,以理解海量数据背後的重要信息和知识,大数据分析技术应运而生。大数据分析是基于IT技术、数据挖掘、记录分析等多门學科的成果应用,通過從海量数据中分析出有效模式,获取存在的关系和规则并對发展趋势作出预测,這也是大数据生态环境中的最重要一环——使数据产生价值。
????????通過都市照明管理行业20数年的迅速发展,路灯遠程自動化监控技术有了很大提高。监控系统每分钟都會产生实時监控数据,运行至今的系统大都已經存储了庞大数据,它們记录了照明监控设备的运行状况。不過人們更关怀它們背後隐含著的知识和信息,這些“数据”中的“数据”可用于运行状况评估、异常预警和後续运行参数调优,對照明管理部门降本增效、不停改善服务质量具有积极指导意义。由此可見,大数据分析技术应用于都市照明管理行业尤為迫切和必要。
????????1大数据分析理论
????????大数据分析理论指從海量数据中分析和挖掘出知识的措施,本文重要采用聚类、分类等措施。
????????1.1数据仓库建立
????????進行大数据分析前必须搜集待分析的数据资源,虽然数据挖掘可直接從操作数据源中挖掘信息,但提议從专用性和可靠性角度考虑,不采用原有的数据库或数据构造,而是将待分析数据存入数据仓库中。
????????数据仓库是一种集成、相對静态、面向主題的数据集合,通過建立数据仓库,可将异种数据源中的数据通過集成,從而构成語义上一致的数据存储体系构造,它可按不一样的主題划分管理决策所需信息,為查询、分析和决策打下基础[2]。
????????1.2特性提取
????????数据仓库中的集合包括了大量特性,為了通過聚类分析发現潜在的运行模式,需要從序列数据中提取反应运行状况的重要特性向量。
????????這重要有两方面的工作:首先為了让模型更轻易理解,需要減少数据集的维度,删除不有关的特性并減少噪声,使大数据分析算法效果更好;另首先通過创立新属性,将某些旧属性合并或创立新的属性,這样可更有效地捕捉数据集中的重要信息。
????????最常使用的特性集提取技术都是高度针對某一详细领域,一旦大数据分析用于其他领域,首要任务就是找到新的特性并進行特性提取。
????????1.3数据预处理
????????由于待分析数据也許存在数值区间范围较大、且不一样步间段内变化快的問題,因此在大数据分析之前必须使用转换措施進行原则化处理。
????????数据原则化转换也是大数据分析中常見的转换措施之一,它通過将数据按照比例進行缩小,使之归入一种较小区间范围内,為数据分析建立相對平等的基础。原则分数(Z-score)是一种数据原则化的重要措施,可以真实地反应一种分数距离平均数的相對原则距离,原则分数可由式(1)求出:
????????Z=X-μσ(1)
????????其中,X為被原则化的数据,μ為数据集的平均值,σ為数据集的原则差。Z值代表著原始数据和数据集平均值之间的距离,它能表明原始数据在数据类集中的位置,以便在不一样分布的数据之间進行比较[3]。
????????1.4聚类算法
????????聚类就是将数据對象分為多种类,类内数据點具有较高的相似度而距离近,类间数据對象差异大而距离點遠[4]。聚类技术可以将数据集划提成不一
您可能关注的文档
- 2025年会务礼仪服务.doc
- 2025年基于ssh的网上商城系统含源文件.doc
- 2025年数字化变电站自动化系统解决方案.doc
- 2025年电梯组装轿厢完整版.doc
- 2025年项目提成管理办法.doc
- 2025年农业政策学.doc
- 2025年小学多媒体教室使用记录表.doc
- 2025年高清视频会议改造系统技术方案.doc
- 2025年闸门及启闭机安装施工方案.doc
- 2025年石方开挖施工方案.doc
- 幼儿园全民国家安全教育日PPT.ppt
- 文明礼仪伴我行主题班会课.ppt
- 4.2 《心有一团火,温暖众人心》课件(共26张PPT) 2024-2025学年统编版高中语文必修上册.pptx
- 大模型平民化开启“AI+医疗”新纪元.pptx
- 2《以工匠精神雕琢时代品质》 课件(共28张PPT)2024-2025学年统编版高中语文必修上册.pptx
- 3《鸿门宴》 课件 (共52张PPT)2024-2025学年统编版高中语文必修下册.pptx
- unit 2能力阅读写作拔高练-学九级英语全一册单元模块满分必刷题人教版.pdf
- 9.3 《声声慢(寻寻觅觅)》课件 (共25张PPT)2024-2025学年统编版高中语文必修上册.ppt
- “4·23世界读书日”主题教育班会-阅读启心智,知识筑梦想 课件(共27张PPT).pptx
- 4EAT 变速箱维修手册.pdf
文档评论(0)