- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
业务大数据治理平台设计方案
大数据治理平台
数据标准管理
为实现数据标准的管理,需要建设标准管理系统,数据标准管理体系贯穿整个区域健康大数据平台的生命周期,是平台建设的基础和首要工作。主要分为对资源的分步管理和阶段性管理,由来源管理、CDA管理、数据元管理和数据集管理组成基本的标准体系。按照不同的标准版本形成标准的阶段性升级,形成标准的上传下达,变更维护,统一更新等一致性管理体系。
1、来源管理
根据国家标准将数据集、数据元按照不同的业务分类进行来源管理,例如WS365-2011城乡居民健康档案基本数据集、妇幼保健信息系统基本数据集等进行管理,提供日常的来源关系维护等。
2、数据元管理
数据元是标准中的最小粒度,是数据集的组成参照,管理了国家标准中的参照格式和字典映射,所关联的字典来自于国家标准字典集,数据元管理提供日常维护功能。
3、数据元导入/导出
支持数据元导入/导出功能。
4、数据集管理
数据集作为数据元的集合,是交换文件的组成部分,提供了基本的标准库表结构,维护了和数据元的关联关系,并形成与数据元的映射,定义字段和字段相关属性信息等,数据集管理提供日常维护功能。
(1)数据集导入/导出
支持数据集导入/导出功能。
(2)关联字段配置
关联字段配置进行每个数据集关联字段的管理和维护,关联字段用于数据集间的关联查询,一般为数据集的主键。
(3)子级数据集配置
子级数据集配置进行数据集的子级数据集管理和维。
5、共享文档(CDA)管理
共享与交换文件(CDA)是档案调阅和交互的模版,通过对CDA与数据集的管理维护,形成档案的数据业务来源,并且对CDA的解析文件和展示文件进行统一管理,并可以进行结构化的展示。
(1)关联数据集管理
关联数据集管理主要包括CDA关联的数据集列表的管理和维护,设置关联数据集的主表(主表只能有一个)。
(2)XSL(转换文件)配置
XSL配置的主要功能是导入xsl文件,导入后,可以选择“解析成HTML”和“解析成CDA”标签页来查看,选择“预览HTML”,可以查看转换成页面的展示效果,选择“结构化视图”,可以查看结构化视图详细展示。
(3)样例XML配置
样例XML配置可以对CDA的样例xml信息进行配置和维护,可以导入需要的xml文件,选择“结构化视图”,可以查看结构化视图详细展示。
6、版本管理
标准版本的生成是在标准定义的基础上进行定制生成,为特色化的服务需求生成涵盖整个标准结构的数据,也可以进行阶段性的管理,为标准的变更提供依据和记录。
(1)关联数据集配置
关联数据集配置关联的数据集信息,选择相应数据集,显示该数据集的字段,勾选需要的数据集和字段即可。
(2)关联字典配置
关联数据集配置关联的字典信息,选择相应字典,显示该字典的字典项,勾选需要关联的字典即可。
7、数据集字段映射
对于归档过程中存在同一份档案对应的多张表,需要有一张对应的表来唯一确认该事件要生成几份档案,CDA与数据集形成一对多关联,通常在同一个CDA中有一张表作为主表,用机构编码,病人ID,事件号对主表进行筛选,查询出来的记录条数应当是当前时间对应的档案数,数据集字段映射配置提供日常维护功能。
数据质量管理
为实现数据资源中心数据质量,从互联互通标准出发,基于平台构建医疗健康数据质控管理系统,确保数据上报工作的数据质量,从数据源头抓起,对数据从产生到应用整个生命周期的全过程进行监管与考核,促进平台数据质量的提高。
1、监控管理
(1)过程监控
实现全过程数据质量控制。即从数据的来源开始,到数据资源中心当中经历的所有环节进行数据质量控制。
(2)数据监控
实现全方位数据质量控制。即从数据的有效性、关联性、准确性、完整性、稳定性、及时性等方面来进行数据质量控制。
(3)业务质控
实现从数据质量到业务质量的质量控制。即在数据质量监控的基础上加入业务分类,完成不同业务领域的质量监控。
(4)评价体系
实现数据质量评价体系。即从数据质量报告及数据质量分析等多种手段实现数据质量评价。
2、数据校验原则
数据校验需求可以满足不同的系统使用者从不同的角度对数据进行分析。校验原则主要包括数据完整性、准确性、一致性三方面的规则。
(1)完整性
完整性指的是数据信息是否存在缺失的状况。
数据缺失的情况可能是整个数据记录缺失,也可能是数据中某个字段信息的记录缺失。不完整的数据所能借鉴的价值就会大大降低,也是数据质量最为基础的一项评估标准。
(2)一致性
一致性是指数据是否遵循了统一的规范,数据集合是否保持了统一
文档评论(0)