- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分析方法与过程数据清洗从业务以及建模的相关需要方面考虑筛选出需要的数据通过数据的探索分析发现在用电类别中非居民用电类别不可能存在漏电窃电的现象需要将非居民用电类别的用电数据过滤掉结合本案例的业务节假日用电量与工作日相比会明显偏低为了尽可能达到较好数据效果过滤节假日的用电数据第步数据预处理数据缺失严重分析方法与过程缺失值处理第步数据预处理分析方法与过程缺失值处理在原始计量数据特别是用户电量抽取过程中发现存在缺失的现象若将这些值抛弃掉会严重影响后续分析结果第步数据预处理分析方法与过程缺失值处理第步数
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 分析方法与过程 数据清洗:从业务以及建模的相关需要方面考虑,筛选出需要的数据 通过数据的探索分析,发现在用电类别中,非居民用电类别不可能存在漏电窃电的现象,需要将非居民用电类别的用电数据过滤掉。 结合本案例的业务,节假日用电量与工作日相比,会明显偏低。为了尽可能达到较好数据效果,过滤节假日的用电数据。 第3步:数据预处理 数据缺失严重 分析方法与过程 缺失值处理: 第3步:数据预处理 分析方法与过程 缺失值处理:在原始计量数据,特别是用户电量抽取过程中,发现存在缺失的现象。若将这些值抛弃掉,会严重影响后续分析结果。 第3步:数据预处理 分析方法与过程 缺失值处理 第3步:数据预处理 分析方法与过程 缺失值处理 拉格朗日插值法 其中 为缺失值对应的下标序号, 为缺失值的插值结果, 为非缺失值 的下标序号。 牛顿插值法 第3步:数据预处理 编程练习 分析方法与过程 数据变换 电量趋势下降指标 线损指标 告警类指标 第3步:数据预处理 分析方法与过程 数据变换 电量趋势下降指标 从正常用电到窃漏电特征分析 第3步:数据预处理 用电量趋势 正常用电 正常用电 第1天窃漏电 第2天窃漏电 第3天窃漏电 分析方法与过程 数据变换 电量趋势下降指标 对统计当天设定前后5天为统计窗口期,计算这11天内的电量趋势下降情况,首先计算这11天的每天的电量趋势,计算第i天的用电量趋势是考虑前后5天期间的用电量斜率,即: 第3步:数据预处理 其中 , , 为第 天的电量趋势, 为第 天的用电量。 分析方法与过程 数据变换 电量趋势下降指标 若电量趋势为不断下降的,则认为具有一定的窃电嫌疑,故计算这11天内,当天比前一天用电量趋势为递减的天数,即设有 则这11天内的电量趋势下降指标为 第3步:数据预处理 分析方法与过程 数据变换 电量趋势增长指标 线损指标 第3步:数据预处理 线损率公式: 其中 为第 天的线路供电量, 为线路上各个用户的总用电量 分析方法与过程 数据变换 电量趋势增长指标 线损指标 线路的线损率可作为用户线损率的参考值,若用户发生窃漏电,则当天的线损率会下降,但由于用户每天的用电量存在波动,单纯以当天线损率下降了作为窃漏电特征则误差过大,所以考虑前后几天的线损率平均值,判断其增长率是否大于1%,若线损率的增长率大于1%则具有窃漏电的可能性。 对统计当天设定前后5天为统计窗口期,首先分别计算统计当天与前5天之间的线损率平均值 和统计当天与后5天之间的线损率平均值 ,若 比 的增长率大于1%,则认为具有一定的窃电嫌疑,故定义线损指标 第3步:数据预处理 分析方法与过程 数据变换 电量趋势增长指标 线损指标 告警类指标 与窃漏电相关的终端报警主要有电压缺相、电压断相、电流反极性等告警,计算发生与窃漏电相关的终端报警的次数总和,作为告警类指标。 第3步:数据预处理 分析方法与过程 对2009年1月1日至2014年12月31日所有窃漏电用户及部分正常用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识,按窃漏电评价指标进行处理,得到专家样本库。 第4步:构建专家样本 分析方法与过程 第5步:构建模型 构建窃漏电用户识别模型 对专家样本随机选取20%的作为测试样本,剩下80%的作为训练样本。 LM神经网络建模 CART决策树建模 编程练习 分析方法与过程 第5步:构建模型 构建窃漏电用户识别模型 LM神经网络 由混淆矩阵(训练样本),分类准确率为94.0%,正常用户被误判为窃漏电用户占正常用户的3.4%,窃漏电用户被误判为正常用户占正常窃漏电用户的2.6%。 分析方法与过程 b) CART决策树 由混淆矩阵(训练样本),分类准确率为95.3%,正常用户被误判为窃漏电用户占正常用户的1.3%,窃漏电用户被误判为正常用户占正常窃漏电用户的3.4%。 分析方法与过程 第5步:构建模型 模型评价 用测试样本对两个模型进行评价,评价方法采用ROC曲线进行评估。 观测LM神经网络和CART决策树ROC曲线的CLASS2折线,经过对比发现LM神经网络的ROC曲线比CART决策树的ROC曲线更加靠近单位方形的左上角,LM神经网络ROC曲线下的面积更大,说明LM神经网络模型的分类性能较好,能应用于窃漏电用户识别。 LM神经网络在测试样本下的ROC曲线 CART决策树在测试样本下的ROC曲
您可能关注的文档
- 地方政府卫生支出财政分权与居民健康水平-社科网.pdf
- 低碳窈窕活力餐吃出环保健康观-奇美医院.pdf
- 地氟病防制知识-yudasaocom.ppt
- 低浓度预吸氧对3651m海拔新兵体能pwc170值的影响.pdf
- 底栖动物在南洞庭湖岸边污染带水质评价中的应用冰-环境科学.pdf
- 地理人教版选修2同步训练人类与海洋协调发展.doc
- 地幔的微量元素-institutfürendlagerforschung.ppt
- 地球-johnsonmatthey-codeofethics.pdf
- 地下电力电缆电磁场对城环境的影响分析与评价-甘肃科技.pdf
- 地铁车辆电动塞拉门的剩余寿命预测-中国机械工程.pdf
- 2024年简短的教师转正自我鉴定范文(3篇).pdf
- 2024年上海市安全员-A证考试题库及答案.pdf
- 2024企业内部开展“大学习、 大培训、 大考试”模拟试题(含答案).pdf
- 2023年中考生物复习专题03 生物体的结构层次》考点训练(解析版).pdf
- 2024届福建省龙岩高中高三3月学生学业能力调研考试生物试题含解析.pdf
- 2023项目经理个人工作总结(分享10篇).pdf
- 2022~2023海船船员考试考试题库及答案第175期.pdf
- Javascript综合复习试题大全和答案.pdf
- 小学数学人教版(2024)一年级上册(2024)《11~20的认识(1)》教学设计.docx
- 2024年关于教师信息技术培训的通知.pdf
文档评论(0)