- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ICS35.020
34
CCSL70
安
徽
省
地
方
标
准
DB34/T4853.3—2024
农村供水管理系统数据加工
Dataprocessingofruralwatersupplymanagementsystem
2
024-07-30发布
2024-08-30实施
安徽省市场监督管理局
发布
.
前
言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件是DB34/T4853《农村供水管理系统》的第3部分。DB34/T4853已经发布了以下部分:
—
—
—
—
—
—
—第1部分:数据元;
—第2部分:数据采集;
—第3部分:数据加工;
—第4部分:数据存储;
—第5部分:应用服务;
—第6部分:运行维护。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由安徽省水利厅提出并归口。
本文件起草单位:安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中
心站)、中水三立数据技术股份有限公司、安徽省农村饮水安全技术中心、安徽农业大学、安徽金海迪
尔信息技术有限责任公司、安徽省大禹水利工程科技有限公司。
本文件主要起草人:沈超、王跃国、刘怀利、廖丽霞、张成、杜运成、姚建国、李羊第、李家耀、
张啸天、郑锐、周婷、刘星宇、姚礼帮、孙靖堂、赵辉、邱丽媛、顾庆玮、李伟、吴霜、张国繁、葛梦
瑶。
农村供水管理系统数据加工
1
2
范围
本文件规定了农村供水管理系统数据的分类、抽取、清洗、标准化转换、入库以及数据安全与记录。
本文件适用于农村供水管理系统的数据加工。
规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本
文件。
GB/T20271信息安全技术信息系统通用安全技术要求
3
3
术语和定义
下列术语和定义适用于本文件。
.1
前置数据库predatabase
采用主从复制技术实现的原始数据库的镜像数据库,可用于向外界提供相关数据并确保原始数据库
数据安全。
4
流程
数据加工流程见图1。
数据分析
数据抽取
数据清洗
不可修正的
不通过
结果检验
错误数据修正
异常数据处置
通
过
可修正的
标准化转换
数据入库
图1数据加工流程
5
5
数据分类
.1待加工数据根据农村供水管理业务应用划分为基础数据、监测数据、业务数据、地理空间数据、
外部共享数据五类。
5
5
.2应根据数据分类明确对应的数据加工路径、加工规则、加工目标数据库及相应库表信息。
.3采用系统或人工方式将不满足农村供水管理系统业务需求、不符合数据格式要求、元数据或相关
资料描述不完整的、数据关系不明确的数据筛除。
6
数据抽取
6
6
.1应通过数据来源的前置库进行抽取。
.2每次数据抽取工作应至少记录抽取标志位、抽取时间、抽取来源、抽取数量、目标库表、抽取完
成情况、操作人员;抽取操作中断时可通过抽取标志位、抽取时间确定抽取的数据。
6
6
6
.3数据传输应通过https、TLSP等协议进行安全加密传输。
.4首次抽取应采用全量抽取方式,非首次抽取宜采用增量抽取方式。
.5结构化数据宜采用直接读库方式抽取,半结构化和非结构化数据宜通过数据服务方式抽取。
7
数据清洗
7
7
.1清洗原则
.1.1准确性、完整性:应通过极大值、极小值、负值、空缺值、数据类型错误进行判定。
7
7
.1.2符合性:结合农村供水管理业务应用规则和逻辑对数据准确性进行判定。
.1.3唯一性:通过主键或标志位检验等策略制定数据唯一性检验和去重规则。
7
.2清洗操作方法
7
7
7
7
7
7
7
.2.1根据业务需求将非结构化和半结构化数据(并非全部)转化为结构化数据。
.2.2删除或修改不一致的数据。
.2.3利用相关性分析方法消除冗余数据。
.2.4删除噪声数据。
.2.5删除业务数据中不符合应用规则或有逻辑错误的数据。
.2.6处理空缺值。
.2.7将过滤删除掉的数据存入问题数据库表。
7
.3结果检验
7
7
7
7
7
.3.1对清洗后数据对象的数据类型、数值、长度、格式以及数据内容的表述进行准确性检验。
.3.2应对每个数据字段内容的完整性进行检验。
.3.3应对清洗前后的数据量进行比对。
.3.4系统应建立异常反馈机制,将发现的异常数据及时反馈给原数据提供单位。
.3.5对检验过程中发现的错误数据进行修正。
8
8
标准化转换
.1转换规则
农村供水管理系统业务数据标
您可能关注的文档
- DB34T 4824-2024地质标本登记著录规范.docx
- DB34T 4850-2024河道软土边坡水泥土搅拌桩处理技术导则.docx
- DB34T 728-2024长输天然气管道检验规程(常规检验).docx
- DB34T 4911-2024决策气象服务产品制作规范.docx
- DB34T 4882-2024地理标志产品亳菊.docx
- DB34T 4823-2024切坡建房地质灾害防治技术规程.docx
- DB34T 4815-2024实验动物环境条件.docx
- DB34T 4863-2024可移动文物三维数字信息采集与建模指南.docx
- DB34T 4887-2024消费品召回风险评估指南.docx
- DB34T 4906-2024煤矿井下抑尘施工效果评价规程.docx
- 大学生职业规划大赛《新闻学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《应用统计学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《中医学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《信息管理与信息系统专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《汽车服务工程专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《水产养殖学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《市场营销专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐表演专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
文档评论(0)