03_数据中心HDW解决方案.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据中心HDW解决方案

背景

近年来,随着医疗市场的激烈竞争,医院管理已逐步从传统经验型向科学量化管理方向发展,特别是医院的重大决策需要科学数据分析作为依据。建设一个提升医院运营能力的数据仓库,不但有效地支撑医院管理决策,而且对加快医院科研进程,提高医院诊疗水平和教学质量,提升医院的品牌服务能力,都将产生深远的影响。

系统介绍

HDW系统(OperationalDataStore)是“一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体细腻的需求”。业务应用环境的数据经过转换和整合进入HDW,提供了一种全局的集成的和即时的企业操作视图,能够支持企业即时性的决策需求。

总体建设方案

总体架构

卫宁健康数据中心HDW系统是将医院各个业务系统数据集成到一个独立的数据库,并对抽取的数据进行数据清洗(Extract),转换(Transform),加载(Load)到HDW数据库。提供给CDR(患者360视图),科主任系统、院长决策、质量指标和数据校验系统进行模型构造、数据汇总和报表展示,并以WebService、数据库视图提供给第三方系统调用。

技术架构

HDW技术层包含:数据源层、ETL层(数据抽取、清洗、转换和载入)和控制访问层。

数据源层:是指医院各个业务数据,可以是卫宁健康系统产品,也可以是第三方业务系统。数据来源类型可以是关系型数据库(SQLServer、Oracle、DB2...),也可以是非关系型数据类型(WebService、PDF、XML...)。

ETL层:将数据从源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的HDW的过程。

控制访问层:通过统一指定的数据接口,提供BI系统数进行报表展示(Report)、即席查询(Ah-hoc)、数据分析(DataAnalysis)和数据挖掘(DataMining)。

部署架构

在代理服务器上,通过部署抽取包、创建代理作业、定时间计划,将各个业务系统对应的业务数据抽取到HDW/暂存库/日志数据库中。

系统安全架构

数据仓库的安全水平及控制

当企业对越来越多的用户开放期HDW中的数据时,提供数据访问和维护数据安全必然成为一对矛盾,尤其是当期HDW中有多种不同的数据库平台时,保持适当的安全水平就是一个极为重要的问题。安全水平可以分为三个层次:通过操作系统注册访问系统、应用程序水平的安全以及数据库访问。其中通过操作系统注册访问系统这一层出的安全是保证经过授权的用户能够访问计算机系统,这一般是借助于用户标识符和口令实现,即通常说的用户鉴定或登录,它为确定个人责任提供了依据。建立了用户标志符之后,就可以通过系统安全软件包授予系统特权。在某些环境中,这些系统特权也可以授予数据库管理员,没有数据库责任的管理员也可以在数据库环境中拥有权力。使用这些方案,安全管理人员可以确认用户责任、口令模式、口令期限。另外,安全系统还可以控制无效尝试口令的次数,在注册时报告自上次成功注册后不成功尝试的次数等。

安全后门问题及其解决

初次安装安全系统时,开发商一般会提供一个默认的用户标志符口令以及进行首次注册。例如,SQLServer提供的用户标志符和口令是sa,这个标识符拥有在系统内可得到的任何权利:访问所有数据、执行所有管理功能、管理系统安全以及分配新口令等。解决这一问题的方案较简单,禁用该用户给其他操作员使用。重新创建一个合适的用户标志符。

数据抽取方案

通过ETL工具,将源业务系统数据(结构化数据库、文件类型数据、WebService、其他)抽取到临时库,在对数据进行转换和清洗,最终导入到目标数据库HDW。

ETL简介

ETL,英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)的过程。

数据抽取:从源数据系统抽取目标数据源系统需要的数据;

数据转换:将从源数据获取的数据按照业务需求,转换成目的数据源要求的形成,并对错误、不一致的数据进行清洗和加工;

数据加载:将转换后的数据装载到目的数据源。

ETL作为构建数据仓库的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时表中,成为联机分析处理、数据挖掘的基础。现在越来越多的将ETL应用于一般信息系统数据的迁移、交换和同步,流程如图所示。

目前市场上常见的ETL工具有SSIS、Kettle、Informatica、Datastage等,结合众多医院系统数据库环境最终我们选择微软的SSIS。

SSIS:(MicrosoftSQLServerIntegrationServices的简称)是生成高性能数据集成解决方案的平台。集成SQL

文档评论(0)

无名 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档