- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
临床科研数据分析的注意事项
重复测量资料统计分析常见错误 重复进行各时间点不同组别间的t(或F)检验 忽略个体曲线变化特征 重复测量数据不满足常规曲线拟合方法所要求的独立性假设 差值比较缺乏信度 用差值做组间比较须慎重 须与协方差分析区别开来 案例2 不同处理措施和时间对某一指标的影响 试验对象:大鼠(每个时点宰杀一批) 问题 A、B处理效果间有无差异? AT2、BT2间有无差异? 处理 T1 T2 T3 T4 A xa11,xa12, xa13,…,xa1i xa21,xa12, xa23,…,xa2i xa31,xa32, xa33,…,xa3i xa41,xa42, xa43,…,xa4i B xb11,xb12, xb13,…,xb1i xb21,xb12, xb23,…,xb2i xb31,xb32, xb33,…,xb3i xb41,xb42, xb43,…,xb4i 案例2 研究设计 重复测量设计? 两因素两水平的析因设计? 随机区组设计? 三者的异同点是什么? 温州医科大学附属眼视光医院·临床与流行病学研究中心 临床科研中数据分析的常见注意事项 毛广运 生物统计中心 提纲 数据处理的一般原则与基本内容 统计方法选择的基本思路 具体案例分析 几种比较实用的方法 附录:常用数据分析的SAS程序 第一部分 数据处理的一般原则与基本内容 数据处理 数据处理 定义: 对数据的采集、存储、检索、加工、变换和传输。 基本目的: 从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。 组成 数据管理(约占全部工作量的60%-80%) 数据分析(约占全部工作量的20%-40%) 数据处理的一般原则与基本内容 数据库设计 数据录入 数据管理 数据审核 异常(缺失)值的处理 统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。 数据分析 统计方法的选择 统计描述与统计推断 离群数据的处理 离群数据 严重偏离群体平均水平的数据,多为错误(如DBP=880mmHg),少量为异常的真实值 可严重掩盖事实真相或扭曲两者间的关系 处理原则 手工处理: 正态分布:>3×|均数±标准差| 偏态分布:>99.5%或<0.5% 软件处理 箱式图:距箱体底线或顶线距离超过箱体高度1.5~3倍者 缺失数据的处理 缺失值 部分研究指标记录不完整,导致其值缺失 后果:导致研究效率的下降 数据的常见缺失机制 完全随机缺失:缺失资料与完整资料的特征无显著性差异 非随机缺失:缺失资料与完整资料的特征存在显著性差异 常见处理措施 直接剔除:适用于缺失量极少且为完全随机缺失 单独列为一类:适用于缺失量较大,且难以合理填补者 缺失值填补: 均数替代 中位数替代 最后观察值结转 回归算法 多重填补法 统计方法前提条件的检查与描述 统计学最难以掌握之处 数据分析人员最应该首先掌握的技能 熟悉各种统计方法的前提适用条件 合理选择最合适的统计方法 第二部分 统计方法选择的基本思路 统计方法选择的核心要素 研究目的 组间差异 显著性检验?优效性检验?等效性检验?非劣效性检验? 相互关系 相关与回归、关联性分析(OR、RR、AR)、其它 设计类型 完全随机设计? 配对设计? 随机区组设计? 交叉设计? 析因设计? 其它设计? 数据类型 计量资料?分类资料?等级资料? 分布特征 正态分布?对数正态分布?其它偏态分布? 统计方法选择总结 统计方法选择总结(续) 统计方法选择总结(续) 常见统计分析的错误 普查还是抽样调查? 普查无统计推断 随机抽样还是非随机抽样? 非随机抽样不能使用普通的统计推断方法 资料类型误认 未能满足所选择统计的前提适用条件 单因素ANOVA代替重复测量资料的方差分析 常见统计分析的错误 未进行数据审核 数据中存在逻辑错误 数据中存在异常值 数据中存在过多的缺失值 常见统计分析的错误 统计方法选择不当 选择t检验时未考虑数据的分布类型 将方差分析拆分成多个t检验 用单因素方差分析解决重复测量资料 使用四格表卡方检验时未考虑N和T的大小 使用卡方检验解决等级资料问题 使用线性回归解决非线性问题 使用Logistic回归解决队列研究的资料 使用普通方差分析解决协方差/多元方差分析问题 多元统计时未考虑自变量的共线性 主成分分析与因子分析误用 其它 线性回归与非线性回归 常见统计分析的错误 结果表述不当 过于看重P值的大小而忽视Power的影响 片面夸大统计学意义的作用 错误理解P<0.01与P<0.05的关系 显著性检验包打天下 优效、等效和非劣效性检验少为人知 Intervention Control t p example1 21.1±2.2(10) 22.
文档评论(0)