- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1
物联网数据质量
1范围
本文件规定了数据质量的等级划分要求和数据质量的评价等级规范。
本文件适用于数据全生存周期各个阶段的数据质量过程。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其必威体育精装版版本(包括所有的修改单)适用于本文件。
GB/T36344—2018信息技术数据质量评价指标
3术语和定义
3.1下列术语和定义适用于本文件。
数据data
信息的可再解释的形式化表示,以适用于通信、解释或处理。
注:包括政府部门、团体机构、企事业单位和个人。
[来源:GB/T5271.1—2018,定义01.01.02]
3.2
数据质量dataquality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。
[来源:GB/T36344—2018,定义2.3]
3.3
数据集dataset
具有一定主题,可以标识并可以被计算机化处理的数据集合。
[来源:GB/T36344—2018,定义2.6]
3.4
等级评价evaluation
按照不同等级的定义和描述进行评估给出评价结果。
4评价框架
数据质量评价是在评价保障基础上通过确定评价对象,业务权重和数据权重的分析,对数据选取的准确性、一致性、完整性、规范性、时效性和可访问性等指标进行数据质量检查,计算数据质量评价分数,确定数据质量等级的过程。
2
数据质量检查评价指
数据质量检查
评价指cv标选取
规则cv匹配
检查cv实施
质量等级划分
质量等cv级划分
价值等cv级划分
评价对象确定
数据范cv围界定
权重分析
应用场cv景分析
业务权cv重分析
数据权cv重分析
评价结果计算
质量检cv查分数
评价指cv标权重
业务综cv合评价
评价保障
制度cv保障
平台cv保障
技术cv保障
安全cv保障
图1数据质量等级评价框架
数据质量等级评价流程主要包括评价对象确定、权重分析、数据质量检查、评价结果计算、质量等级划分和评价保障等七个环节。
5评价对象确定
5.1概述
评价对象确定是指对评价数据进行范围界定。
5.2数据范围界定
与数据提供方人员沟通确定进行质量评价的数据范围,可以划分到表或者字段粒度。对数据的业务场景进行分析,确定数据字典内容,检查数据项属性。
6权重分析
6.1概述
3
权重分析是指通过分析数据应用场景对数据层面进行业务权重分析和对字段层面进行数据权重分析。
6.2应用场景分析
与数据提供方人员沟通明确数据应用场景。
应考虑数据内外部场景分类情况;
应考虑数据的内部增效情况;
应考虑数据的外部增值情况。
6.3业务权重分析
分析字段属性在数据质量评价过程中的重要性程度,从以下角度对数据重要程度分析:应考虑数据字段在业务场景下是否为核心字段;
应考虑数据和业务的关联度情况;
应考虑数据访问的频度。
6.4数据权重分析
分析每个字段属性在数据质量评价过程中的重要性程度。从以下角度对重要程度分析:应考虑评级需求:明确数据评级的目的;
应考虑场景需求;
应考虑行业需求。
7数据质量检查
7.1概述
参考下述准确性、一致性、完整性、规范性、时效性和可访问性,依据所选择的评价维度范围,对数据进行数据质量检查,统计符合评价维度的数据项。
7.2指标选取
依据数据属性选择准确性、一致性、完整性、规范性、时效性和可访问性等评价维度指标。
7.2.1准确性
准确性用于度量数据和信息的正确或者描述真实实体的真实值的程度,主要是数据内容的准确率、精度准确率、记录重复率和脏数据出现率等。
7.2.2一致性
一致性用于度量数据值在数据信息含义上的冲突程度,主要是元素赋值一致率的程度。
7.2.3完整性
完整性用于度量数据丢失或者数据不可用的程度,主要是数据元素填充率、记录填充率和数据项填充率。
4
7.2.4规范性
规范性用于度量数据按规定格式存储的程度,主要是数据值域合规率、元数据合规率、格式合规率和安全合规率等程度。
7.2.5时效性
时效性用于信息在规定时间段内具有数据价值属性的程度,主要是数据的周期及时性和实时及时性等。
7.2.6可访问性
可访问性用于用户进行查询和修改数据能力的程度,主要是数据的可访问度。
7.3规则匹配
依据数据字典和评价指标制定符合评价指标描述的数据字段匹配规则。
7.4检查实施
依据评价指标通过匹配的规则对数据进行规则匹配检查,获得符合评价指标的数据检查信息。
8评价结果计算
8.1概述
评价结果计算是指通过数据
您可能关注的文档
- 众安在线财产保险股份有限公司附加个人恶性肿瘤赴日治疗医疗保险条款(互联网-支付宝专用2021版A款).docx
- 无人船快速性试验方法.docx
- 无人船艇海上测试管理规范.docx
- 众安在线财产保险股份有限公司附加个人恶性肿瘤海外医疗保险(互联网2022版A款)费率表.docx
- 无人机飞防植保操作技术规程.docx
- 众安在线财产保险股份有限公司附加个人恶性肿瘤海外医疗保险条款(互联网2022版A款).docx
- 无人机桨发匹配试验技术规范.docx
- 无人机精准测绘技术规范.docx
- 无人机倾斜摄影动态监测.docx
- 众安在线财产保险股份有限公司附加个人互联网药品费用医疗保险(互联网2023版A款)费率表.docx
最近下载
- 25题固定收益分析岗位常见面试问题含HR问题考察点及参考回答.pdf
- 韶关市2025届高三一模(综合测试一) 英语试卷(含答案).docx
- 工作报告及设计心得20160831.pdf VIP
- SPC导入的钢箱截面在生成变截面时,消隐显示各板件连接错乱.pdf VIP
- Lessonsinlifesaving英国短片剧本.docx VIP
- 2019年注册土木工程师(道路工程)考前培训南京班文件-李 雪.pdf VIP
- 上海市2018-2022年近五年中考数学试卷附答案.pdf VIP
- 城轨车站施工与维护——开挖作业.pptx VIP
- 城轨车站施工与维护——围护结构施工及基坑开挖.pptx VIP
- 铁道概论——单元7.7铁路专用通信系统.pptx VIP
文档评论(0)