全民健康大数据融合中心.docx

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

全民健康大数据融合中心

体系框架

一层治理(XTL:多源异构系统融合平台)是通过将人工智能技术、数据治理技术相结合,构建的专业面向医疗健康领域大数据治理体系。包括数据归集、基础治理。

数据归集——数据的同构归集。实现将众多接入的异构数据源经清洗同构、抽取同步到归集库;

基础治理——数据的标化治理。实现对数据库的数据的标准化过程,根据医疗健康领域业务维度,形成基础库、医疗信息库、公卫信息库;并为数据的高效使用而构建不同的主题库,包括但不限于门诊、住院、检验、检查、手术等主题库。

云网管理——云梯作为XTL底层支撑技术,可以满足众多业务需,包括:编排、资源调度、容器、应用、微服务、DevOps、可观测等内核引擎。

目前在实际治理过程中涉及的软硬件资源管理和任务调度。包括资源的统一容器管理、任务的统一调度管理、安全的统一监控管理、网关管理。

数据源同构

数据归集层中从数据源到归集库的过程采用非接口方式实现,通过异构数据源同步和CDC(变化数据同步引擎)实现实时增量数据的同步,并运用人工智能技术实现数据的智能探侦;最终解决医疗卫生领域多年以来数据质量和数据全量问题,为开展全人全程医疗健康服务提供坚实的技术底座。

数据标准化

依据医疗健康行业业务标准、数据标准、技术标准实施标准化。

提供面向数据基础治理的标准制定、治理管理、质控管理工具。包括面向机构的数据抽取管理工作台和全周期数据治理管理平台。

面向信息化、业务的数据治理扩展到面向领域知识的治理,完善领域知识到数据技术的衔接,进一步增强大数据在专业领域的知识价值发挥,促进数据治理向健康全生命周期的赋能。

提供面向临床、科研、管理、公卫多领域的算法模型能力。

标准和安全体系

标准体系建设

截止到2021年,国家卫健委发布的医疗卫生行业标准共227个,其中涉及数据标准的内容共110个,例如:《卫生信息数据模式描述指南》、《卫生信息基本数据集编制规范》等。

医疗健康大数据治理体系严格遵循国家卫健委发布的《WS363-2011卫生信息数据元目录》、《WS445-2014电子病历基本数据集》、《WS365-2011城乡居民健康档案基本数据集》等国家标准和行业标准。此外,多年医疗行业建设经验,依据智慧医疗、智慧公共业务需求进行数据集和数据元的扩展,截止到目前,共构建医疗服务数据集68个、公共卫生数据集52个。

安全体系建设

安全管理体系。包括完整的安全策略和管理制度、专职安全管理机构和人员、安全建设管理体系、安全运维管理体系。

安全技术体系。包括物理和环境安全、网络和通信安全、设备和计算安全、应用与数据安全。

严格遵循国家《个人信息保护法》和《信息安全技术医疗健康数据安全指南》GB/T39725-2020。

数据一层治理

XTL作为医疗健康大数据治理体系,面向不同层级的数据治理提供了相对应的内核和管理工具,分别是支撑同构、标化治理的5大类内核,以及贯穿全周期数据治理的管理平台、智能化数据有哪些信誉好的足球投注网站工具、机构数据抽取工作台。

五大内核引擎

数据抽取同步引擎

数据抽取(ETL)同步引擎通过对多个异构数据源的结构分析、智能探侦、数据同构、数据清洗、数据抽取同步后存储到归集库(同构库)。

同步机制示例:每15分钟同步前2小时数据,每24小时同步前48小时的数据,每3天同步前7天的数据。

特点:低侵入,易实施,只需开通数据库视图的账号密码;不涉及数据库底层特性,实现比较通用。

此外,此引擎还具有可靠的数据质量监控、丰富的数据转换功能、精准的速度控制、强劲的同步性能、健壮的容错机制等技术优势。

CDC同步引擎

CDC同步引擎解决数据抽取时实时增量数据同步问题。

CDC基于数据增删改日志捕获与重放技术实现实时增量数据的同步。

通过将数据抽取同步和CDC同步引擎相结合实现数据批流一体。

大数据存储引擎

医疗卫生行业领域涉及众多的生产系统,其数据存储大多采用oracle或sqlserver等数据库,由于数据库本身的扩展能力受限,当构建面向全人群全周期的海量医疗健康数据时,数据存储的自动扩展能力将是必须要面临和解决的问题。??

大数据存储引擎支持多种分片策略,使数据能均匀的分布在多台机器上,当服务器的计算或存储能力不足的时候,可以通过增加机器来扩展。并且这一操作对于业务系统而言是透明的,无感知的,也无需业务应用做改造,XTL底层通过数据路由加以实现。

大数据存储引擎还提供高可用存储保障策略,使数据存储时提供多节点的副本(一般为3节点),并且可以做到自动故障切换。当一个节点出问题了,完全不影响使用;当发生双节点故障,能保证数据能读取都但不能写入。

大数据存储引擎还提供高可用访问保障策略,当某个应用业务量增加时,可以设置成独占一个存储节点,专门为这个应用服务提供访问性能保障。

SQL引擎

医疗健康大数据底层使用的不

文档评论(0)

无名 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档