- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
假设检验注意事项
统计学的思维 群体的观点 比较的观点 概率论的观点 发展的观点 生活中的统计思维 小概率事件是指在一次试验(抽样)中认为它不发生。 确定P值,作出统计推论 误差(error) 1、过失误差(错误) 2、系统误差 3、随机测量误差 4、抽样误差 由抽样所引起的,样本统计指标与总体统计指标之间,或者是样本统计指标与样本统计指标之间的差别。 准确度与可靠度 准确度(accuracy)也称真实性(validity) :观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。 可靠度(reliabiliy)—— 也称精密度(precision)或重复性(repeatability) :重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。 假设检验应注意的问题 1.要有严密的研究设计; 2.应根据研究目的、设计类型和资料性质选用适当的检验方法; 3.正确理解“显著性”的含义; 4.假设检验的结论不能绝对化。 如何正确选用统计方法? 第一层面看反应变量是单变量、双变量还是多变量; 第二层面看资料性质是计量资料、计数资料还是等级资料; 第三层面看因素是单因素、双因素还是多因素; 第四层面看样本是单样本、两样本还是多样本; 第五层面看样本设计是配对设计还是配伍设计; 第六层面看是否满足检验方法所需的前提条件。 计量(数值变量)资料统计分析方法 计数资料统计分析方法 等级资料统计分析方法 例子(1) 某药治疗高血压100例,治疗前后差值均数为8mmHg, s=20mmHg. 该药是否有降血压的作用。 结论? 例子(2) 某药治疗高血压1000例,治疗前后差值均数为0.5mmHg, s=5mmHg. 该药是否有降血压的作用。 结论? 误用x2检验分析等级资料 假设某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见下表。经R×C表x2检验,x2=53.33,P0.01,认为两组疗效之间的差异有统计学意义 本资料属于单项有序的R×C表,临床疗效有等级之分,x2检验用于的R×C表只能相互独立的无序的资料。因为(R×C)x2检验只能检验两组内部构成是否相同或频数的分布是否相同。不能检验疗效有无差别。而实际上很难说哪一组疗效更好,读者对表资料任意两列数字进行对换,可以清楚地发现,x2值仍为53.33,不会有改变,因此,对于等级资料可采用Ridit分析或秩和检验。 相关系数的实际意义和P值 小树(X)和婴儿的身高(Y) r=0.998, P0.001 p16 基因表达与胃癌分级的关系 误用χ2 检验回答相关性问题 1.有人研究p16基因表达与胃癌分级的相关性。采用R×C资料的χ2检验,χ2=80.125, P 0.05 ,认为p16基因与胃癌分级之间的相关性有统计学意义。 2.原作者旨在分析p16 基因表达与胃癌分级有无相关性,因此,应当采用Spearman 等级相关分析,计算等级相关系数rs =-0.757, P 0.01 (借助SPSS)。 相关系数的实际意义和P值 相关系数的实际意义和P值 统计推断的风险性和局限性 参数估计中,可信区间的可信度不是100%; 假设检验中,存在I型误差和II型误差。 因此,任何推断结论都不是绝对正确的。 统计推断的结论不能说“证明”,“肯定”。只能说“可以认为”,“推断为”,“尚不能认为”。 香肠的好坏主要取决于香肠里面的肉,肠衣只是它外表的装饰。如果肉质不好,肠衣再漂亮也无济于事。流行病学调查获得的数据就好象香肠里面的肉,如果数据不可靠,再新、再高深的统计学方法也不能将偏倚的结果纠正过来。 永远不要成为统计学的奴隶! A 理想的正常人与糖尿病病人血糖分布 B 现实的正常人与糖尿病病人血糖分布 您可知道自己面临的是什么? 十面埋伏 * * 假设检验的注意事项 拒绝H0,接受H1,差异有高度统计学意义 ≤0.01 ≥t0.01(v) 拒绝H0,接受H1,差异有统计学意义 ≤0.05 ≥t0.05(v) 不拒绝H0,差异无统计学意义 >0.05 <t0.05(v) 统计推断结论 P值 t值 P值的含义是指从H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量的概率。 医学科研工作者误用和滥用统计学的原因 缺乏统计指导 长期习惯 不重视科研统计分析 统计学意识较差 仿效现象 (1)良好地设计 (2)有计划地收集资料 (3)合理地整理资料 (4)正确地分析资料 统计工作的基本步
文档评论(0)