- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卫生统计学与大数据20120910
中国疾病预防控制中心 卫生统计学与“大数据”时代 于石成 2012.09.10 绪论 资料的收集 资料的存贮管理 资料的统计分析 迎接“大数据”时代的挑战 提纲: 一、绪论 资讯革命 – 资讯工具、硬件、软件 个人电脑、互联网、云计算 大量数据公开于大众的时代 大数据战略 - 大数据及其分析将在未来10年改变每一个行业的业务功能 Singapore – 德勤数据分析研究所(DAI) GE – 全球软件和分析中心(旧金山湾,400名数据科学家) 数据科学家(Data Scientist) 收集和开发特定的软件 管理大规模并行服务器产生的结构化和非结构化数据 选定分析软件 – 数据挖掘 数据可视化展示 最小数据集 1973年国家生命健康统计委员会(NCVHS) 1975年美国医院协会(AHA)- 统一账单委员会 国家的管理层面对某个业务管理领域强制收集数据指标 不同组织和机构之间的信息交流 1980年管理信息系统的兴起 大数据和“大数据”时代 不同组织和机构之间的信息交流 1980年管理信息系统的兴起 1. 信息系统收集数据 (1)传染病与突发公共卫生事件监测信息系统 (2)传染病公共卫生实验室监测信息系统 (3)慢性非传染性疾病监测与信息管理系统 (4)健康危险因素监测与风险评估信息系统 (5)预防接种信息系统 (6)生命登记信息系统 (7)疾病预防控制绩效考核与爱国卫生信息系统 (8)职业病网络直报信息系统 2. 数据的来源渠道多了,其内容大大地丰富 3. 数据有新的特点 (1)时序性:同一个变量具有在时间上的连续性 (2)来自不同系统采集的数据之间的的整合、关联和综合分析 二、资料的收集 Internet 国家级平台Intranet 防火墙 省级平台 Intranet 地市级平台 Intranet 调制解调器 县区级工作站 乡镇卫生院 网络电话 PC工作站 PSTN DDN DDN 五级网络 三级平台 纵向到底 安全隧道(VPN) 国家传染病网络直报系统 4. 数据量的无限膨胀 从有限数据到海量数据的积累 – 大数据。 管理数据库,常规工作的积累:没有抽样设计和数据的质量问题。 这是我们处理管理数据库面临的新挑战。 实时存储 -信息系统每时每刻实时收集着各种类型的数据。 存贮方式 - 从集中式存贮到分布式的存贮,“逻辑上统一,物理上分布”。 异地备份 – 容灾中心 三、资料的存贮管理 (一)用户的需求改变了 管理需求增加:决策者更依赖于利用数据、信息来做决策; 疾病预防控制:疾病的发生发展做预测、卫生应急和突发事件的预报预警要求; 监测与评估:在执行项目中,经常需要对项目的实施质量进行跟踪,就要采集项目实施的数据(监测)进行阶段性分析或终末分析(评估)。 四、统计分析的新挑战 (二)信息系统采集数据 带来的问题: 缺少数据收集中的正规设计; 缺少数据收集的质量控制:数据缺失、错误存在。 网络报告的数据,漏报(指报告 不完整)、缺失(指报告的项目填写不完全)、错误存在。 怎么从有偏性的样本推断总体? (三)连续动态资料的分析 五、迎接“大数据”时代的挑战 从数据到知识:决策支持系统和商业智能(一系列以事实为支持、辅助商业决策的技术和方法) 数据仓库:是一个面向主题、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定。 联机分析(Online Analytical Processing):将分立的数据库“相联”,进行多维度地分析。 数据挖掘:对数据进行挖山凿矿式的开采,发掘数据下隐藏的历史规律,对未来进行预测。 数据可视化。 谢谢! * 可比性:不同地区人口年龄构成不同,粗死亡率不可直接比较;不同医院病人病情轻重构成不同,治愈率、病死率不可直接比较。抽样的样本率之间的比较要有可比性。 * * * * * * * * * * * * 中国疾病预防控制中心 * 可比性:不同地区人口年龄构成不同,粗死亡率不可直接比较;不同医院病人病情轻重构成不同,治愈率、病死率不可直接比较。抽样的样本率之间的比较要有可比性。 * * * * * * * * * * * *
文档评论(0)