数据挖掘方法在城市供水管网漏损预测模型中的应用.pdfVIP

下载本文档

8
0
约1.3万字
约 6页
2017-09-13 发布于重庆
举报
版权申诉

数据挖掘方法在城市供水管网漏损预测模型中的应用.pdf

1、本文档共6页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘方法在城市供水管网漏损预测模型中的应用徐强，陈求稳（中国科学院生态环境研究中心，北京 100085）摘要管网漏损是城市供水管网中经常发生的一个问题，它给管网的管理带来了挑战，对安全供水也造成了威胁。然而，用传统的方法来检测漏损点效率比较低，因此，需要建立合理可靠的漏损预测模型来对管道的漏损风险大小进行评估，以对实际的漏损检测提供技术指导。研究选取了北京市主城区供水管网作为实例，收集了管网的基础资料及 1987 至 2005 年间漏损数据，利用两种新颖的数据挖掘方法，建立了管网漏损预测模型，并利用部分数据对模型进行了验证。模型结果可用于对整个管网进行漏损可能性评估，以指导具体的漏损检测工作。关键词供水管网，漏损预测，数据挖掘方法作者简介徐强（1983.8-），男，博士研究生，就读于中国科学院生态环境研究中心，主要从事城市水信息学专业研究。Email: plelynn@ 陈求稳（1974.1-），男，研究员，就职于中国科学院生态环境研究中心，主要从事生态水力学，水信息学，城市水信息学等领域研究。Email: qchen@ 1. 引言北京是世界上最缺水的大城市之一，人均水资源不足 300m3 ，仅为世界平均水平的 1/30，水资源短缺已严重制约北京市的可持续发展[1] 。与此同时，水资源的浪费现象也很严重，其中管网漏失是一个供水管网中普遍存在的问题。目前，世界平均的漏失比例为大于 15%，北京市为 15.9%[2] 。管网漏失不仅会带来巨大的经济损失，也可能会引发一些社会问题，因此必须尽可能地减少管网漏失。而目前漏失管理所面临的一个关键问题就是如何在复杂的管网中找到漏损发生位置。目前，应用最为广泛的检漏方法是音听检漏法。工人利用听音杆或布设专门的声学仪器来捕捉漏水的声音信号，这种传统的方法费时费力。为了提高检漏效率和合理利用有限的资源，应该有针对性地进行漏点排查，因此，需要研究管道的漏损规律，建立漏损模型，从而确定漏损的重 [3-4] [5-6] [7-9] 点监测区。文献报导中，采用的分析方法主要有贝叶斯转换、水力模型以及数据挖掘。本研究收集了 1987~2005 年间的北京市主城区供水管网干线漏损数据，利用遗传编程和进化多项式回归两种数据挖掘方法建立了漏损预测模型，通过模型的应用，确定了北京市主城区的漏失重点监测区。 2. 数据挖掘方法数据挖掘是数据库知识发现（Knowledge-Discovery in Databases, KDD) 中的一个步骤。数据挖掘一般是指从大量的数据中自动有哪些信誉好的足球投注网站隐藏于其中的有着特殊关系性的信息的过程。具体的数据方法有很多，本研究采用了遗传编程（genetic programming, GP ）和进化多项式回归（evolutionary polynomial regression, EPR ）两种数据挖掘方法。因为这两种方法可以用显式的方法将模型结构表达出来，而不同于黑箱模型无法得到模型表达式。遗传编程[10]是一种进化(遗传)计算方法，是由美国的 Koza 教授于 1992 年创立的。它是一种从生物进化过程得到灵感的自动化生成和选择计算机程序来完成用户指定任务的技术，从理论上讲，人类用遗传编程只需要告诉计算机“做什么”，而不需要告诉它“怎么做”，最终可能实现真正意义上的人工智能。遗传编程中，组成种群的个体均为具有树状结构的代数表达式，树的结点由终结点、变量与运算符组成。其基本遗传算子包括复制、交叉和变异。复制是对现有种群中的个体按照某种方式进行选择，适应度高的个体被选中概率大，选中的个体被复制到新一代种群中存活下来。交叉是在当前种群中，根据适应度，按照一定的规则，选择两个父个体，再在两个父个体上随机选择两棵子树，然后交换两棵子树，生成两个新的个体。变异是先按概率选择一个要发生变异的个体，再随机选择一个变异点，然后随机生成一棵新子树以代替变异点为根的子树，变异通常以很小的概率发生(如 5 ％) 。在本研究中，评价这些表达式优劣的方法是计算表达