- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学科研数据挖掘方法--挖掘技术-3讲述
数据统计分析方法(3) (时间考虑) Kaplan-Meier过程 Cox Regression过程 时间序列分析(指数平滑方法、自回归分析、ARIMA过程) 数据统计分析方法(4) (数据结构考虑) 遗传度计算 家族聚集性分析 组内相关分析 数据统计分析方法(5) (多水平分析) 广义线性混合效应模型 (GLMMs) 混合效应模型 混合线性模型(MIXED) 非线性混合效应模型(NLMIXED) 数据统计分析方法(6) (复杂自变量关系分析) 叛别分析过程(DISCRIM) 聚类分析过程(CLUSTER) 主成分分析与因子分析 通径分析 结构方程模型 数据统计分析方法(7) (遗传分析方法) 单体型分析 FBAT分析(TDT,SDT) 交互作用分析(MDR、GMDR、PGMDR) 连锁分析 分离分析 GWS …… 如何正确选择 统计分析方法 统计分析方法如何分类? 因变量 (反应变量) 自变量 时间 数据库(结构) 图1:变量、记录和时间与数据分析的关系 记录 群体(个体)、家系 时间 横断面调查、队列研究 一次调查(检测)、多时点调查(重复测量) 结局变量(因变量)、研究因素(自变量)、协变量。 连续变量、分类变量(二分类,等级变量、无序变量)。 环境因素、临床指标、遗传易感性(基因多态性) 变量 (内容) 记录 (研究对象) 时间 挖掘 (研究设计) 数据 分析 思考点 从研究变量之间关系进行选择 从研究对象构成进行选择 从研究时间进行选择 从以上两个或者三个组合进行选择 如何选择“最完美”的统计方法 统计分析方法应用案例 研究现场:上海、广州、西安、北京、武汉五个城市。 研究设计:队列研究,2001-至今;每两年随访一次。 研究对象:以家庭为单位,对每个家庭人员进行调查。 抽样方法:多阶段分层随机抽样。 流行病学问卷调查:基本信息:年龄、性别、文化程度、婚姻状况、收入;生活环境、行为、饮食习惯;既往疾病史。 体格检查:身高、体重、血压。 临床生化检测:血糖、血脂、肝肾功能, 。 基因分型:10个基因,30个位点,其中部分位点存在连锁不平衡。 二型糖尿病的分子流行病学研究 美国兰德公司在朝鲜战争刚开始时预言——这是选择在错误的时间、错误的地方、同错误的对手打一场错误的战争(Frankly, this strategy would involve us in the wrong war, at the wrong place, at the wrong time, and with the wrong enemy)。 1950年5月 结束语 只有经过正确的数据预处理、选择正确的挖掘技术,才能对正确的数据进行正确的挖掘。 数据挖掘技术(3) 文章错误案例 统计分析方法回顾 如何正确选择统计分析方法 统计分析方法应用案例 文章错误案例 案例一 原文题目:《美喘清和博利康尼治疗支气管哮喘各40例临床疗效与副作用比较》,作者选择80例哮喘病人随机分为美喘清组与博利康尼组各40例,记录各组病人发生疗效的时间(见下表)。所得结果用卡方检验进行处理,认为美喘清较博利康尼发生疗效的时间早,且差异具有统计学意义(P<0.05)。 点评:根据研究目的,每个哮喘患者都能提供一个药物发生疗效的时间,因而此资料从本质土讲应为定量资料,表中结果只是为了表达的方便列出不同时点上的频数分布,并不代表此资料的结果变量就为定性资料。原作者采用卡方检验分析定量资料,所能回答的问题与原作者的分析目的不一致。此时得出的结论只能是美喘清组和博利康尼组在不同起效时间的构成上存在的差别是否具有统计学意义,并不能得出两组起效时间之间的差别具有统计学意义。 案例二 原文题目:《地氟醚对老年病人血液动力学的影响》,为研究地氟醚对老年病人血液动力学的影响,选择腹部手术老年病人(年龄60一74岁)30例,所有病人术前肝肾功能检查均正常。在吸入地氟醚前,监测心输出量(CO)、峰流速(PV)、心率(HR)、校正的血流时间(FTC)、中心静脉压(CVP)、心脏指数(CI)、平均动脉压(MAP)、外周血管阻力(SYR)作为基础值,然后分别调整地氟醚浓度至0.5MAC、1.0 MAC、1.5MAC、2.0MAC,同时测定以上各参数。结果见表。统计学处理:采用T检验来测定差异显著性,P<0.05为有显著性差异。 点评:同一个病人重复测量了若干血液动力学指标,地氟醚浓度是与“重复测量’有关的因素,因而此资料属于具有一个重复测量的单因素设计资料,作者采用T检验进行两两比较,因T检验仅适合分析单因素设计且因素的水个数最多为2的定量资料,因此不适合分析此类资料。根据数据可采用重复测量设计资料的方差分析。 统计学四型错误 Ⅰ型错误:也称假阳性错误
您可能关注的文档
- 医学免疫学双语试题题库讲述.doc
- 2017届鲁教版选修六环境保护单元测试2讲解.doc
- 医务人员压力管理讲述.ppt
- 人文地理 第一章 绪论精要.ppt
- 医学免疫学重点整理讲述.doc
- 2017届鲁教版选修六环境保护单元测试讲解.doc
- 人教英语七年级上starter第一单元第一课时精要.pptx
- 人机交互基础教程第2章精要.ppt
- 医学免疫学题库-安徽中医药大学讲述.doc
- 2017届鲁教版选修六环境保护单元测试3讲解.doc
- 2025年丝芙兰美妆零售体验店门店选址与周边环境优化策略报告.docx
- 2025年企业数字化业务敏捷开发与部署的云原生技术解决方案报告.docx
- 2025年青岛房地产市场区域分化态势及投资机遇研究报告.docx
- 3公路货运行业数字化转型与运力整合的智能物流应用场景研究报告.docx
- 2025年深远海养殖自动化与智能化设备应用报告.docx
- 农村一二三产业融合发展中的政策支持案例分析报告.docx
- 生态翻译学视角下的生态理性特征及其对翻译研究的影响.docx
- 农村一二三产业融合发展乡村旅游融合发展模式创新案例.docx
- 农村一二三产业融合发展中的农村能源技术创新与绿色转型案例分析报告.docx
- 零售行业大数据应用案例研究报告.docx
文档评论(0)