- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
风电机组风速-功率异常运行数据特征及清洗方法
沈小军;付雪姣;周冲成;王伟
【摘要】风功率曲线是考核风电机组发电性能的重要指标,对风电场的运行管理和
电力系统的运行调度都具有重要意义.实际运行过程的设备故障及人为控制因素会
导致风速-功率曲线中存在大量的异常数据,给风功率曲线的后续应用带来严重影响.
本文在分析风电机组风速-功率异常运行数据特征的基础上,根据空间分布位置和形
态将异常数据分为曲线底部、中部、上部堆积型异常数据和曲线周围分散型异常数
据等四类,提出了基于变点分组法与四分位法组合的异常数据识别清洗方法及流程,
与四分位-变点分组法以及局部离群因子算法的对比算例验证结果表明,提出的交点
分组-四分位法可有效识别四种类型的异常数据,流程合理,清洗效果好,效率高,并具
有较强的通用性.
【期刊名称】《电工技术学报》
【年(卷),期】2018(033)014
【总页数】9页(P3353-3361)
【关键词】风电机组;风功率曲线;异常数据;数据清洗
【作者】沈小军;付雪姣;周冲成;王伟
【作者单位】同济大学电气工程系上海200092;同济大学电气工程系上海
200092;同济大学电气工程系上海200092;全球能源互联网研究院北京102209
【正文语种】中文
【中图分类】TP274
风能是一种清洁、可再生的能源,正迅速成为可持续发展和能源战略的重要组成部
分[1,2]。但是风力发电过程中随机变化的风速风向使得风电功率具有波动性、间
歇性和随机性等特征,对电力系统运行的稳定性和可靠性造成不利影响[3-5]。消
除这些不利影响的一种重要手段就是通过风电机组运行数据的挖掘提高风力发电的
可预见性。通过实测风速和功率得到的风功率曲线可用于评估风电机组的性能和运
行状况,对判断风机故障有重要价值,同时时序功率数据也是研究风电功率预测以
及评估风功率对电网影响的基础[6]。因此,准确获得风电机组实际运行的风速和
功率数据,能够为风电场的经济安全运行和优化控制策略提供根本的数据支撑。但
是在风电场运行过程中,由于机组停机、减载、通信噪声和设备故障等因素,会产
生大量异常数据。目前风电机组运行数据的收集、管理、分析和挖掘方法仍存在诸
多不足,不能准确辨识所采集数据的质量差异,进而有效支撑粗糙数据的正确筛选
和合理化优化,造成数据质量得不到保障[7]。如果这些数据不经处理直接使用,
得到的风力发电统计特性发生畸变,会影响风电机组的运行状态和运行特性的分析
结果。为了提高数据质量,数据清洗已成为数据挖掘过程中不可或缺的环节[8]。
风电机组异常运行数据的识别与清洗是当前的研究热点,已开展大量工作并取得了
诸多研究成果,其中风电机组风功率曲线数据清洗的代表性成果有:文献[9]采用
的四分位法是一种常用的异常数据识别方法,但是当异常数据所占的比重较大时,
四分位法识别异常数据的效果变差;文献[10]采用四分位法与k-means联合算法
剔除异常数据,但由于k-means算法属于分类算法,可能会导致正常数据的误删,
且k值的确定比较复杂,对数据处理结果影响较大;文献[11]采用组内最优方差算
法实现了功率曲线下方的堆积型异常数据的有效识别效果,但该算法将每个风速区
间内最大的功率默认为风机满发功率,无法识别功率曲线上方的异常数据;文献
[12]通过建立风功率曲线的非线性模型实现异常数据的识别,该方法需要大量的正
常数据作为样本,否则训练误差会较大,另外数据处理速度较慢;文献[13]在假设
风功率的概率密度函数服从正态分布的基础上,提出了基于3s法则的异常数据清
洗方法,与实际风电运行数据中由于堆积型异常数据的存在风功率的概率密度函数
往往呈双峰或多峰分布不符,其普适性及异常数据识别效果不好;文献[14,15]采
用基于密度的局部离群因子(LocalOutlierFactor,LOF)算法,把具有足够高密
度的区域划分为簇,实现了分散型异常数据的有效识别,但不能有效识别密度较高
的堆积型异常数据。
综上所述,当前风电机组风速-功率运行数据清洗方法从原理上可分为三类:第一
类方法是根据数据点的密度或距离来判断该点是否为异常点,但该类方法对分布密
集的堆积型异常数据识别效果有限;第二类方法是建立风功率曲线的数学模型,但
此类方法需要大量正常数据作为样本,且普适性较差;第三类方法是根据异常数据
的位置分布特征识别异常数据,该类方法的依据是异常数据点位于风功率曲线正常
出力特性范围之外,理论上可实现多类型异常数据的清洗,而且不需要数据
文档评论(0)