网站大量收购闲置独家精品文档,联系QQ:2885784924

复旦大学公共卫生学院卫生统计学课件 相关分析.ppt

复旦大学公共卫生学院卫生统计学课件 相关分析.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
直线相关 直线相关的掌握要点 直线相关描述了什么问题? 直线相关分析的具体步骤是什么? 直线相关分析对资料有什么要求? 如何对这些要求进行检查或检验? 仅用样本直线相关系数能否说明相关程度? 总体相关系数非常接近1,能否说明Y=X? 线性相关 例:考察身高与体重的伴随关系 线性相关 图中不是每个身材较高的对象必有较重的体重,但大多数对象的体重Y与其身高X的变化呈一种伴随增大或减小的直线变化趋势,这种现象称为直线相关 。 线性相关 线性相关系数 相关系数是描述两个变量之间线性相关的程度和相关方向的统计指标。 线性相关系数 样本相关系数的计算 一般而言,总体相关系数?是未知的,通常用样本相关系数r进行估计。样本相关系数r按下式计算: 上述相关系数又称为Pearson相关系数 相关系数性质 无量纲 取值范围为-1? ? ? 1 ,-1? r ? 1 ?0表示正相关; ?0表示负相关; ?=0表示零相关。 |?|越接近1,表示相关程度越密切 |?|越接近0,表示相关程度越不密切 线性相关示意图 线性不相关示意图 实例分析 例:随机抽取15名健康成人,测定血液的凝血酶浓度(毫升)及凝血时间(秒)。问:这两项指标是否线性相关? 实例分析 样本相关系数计算可以简化为 实例分析 本例: 样本相关系数与样本量 样本相关系数r的大小与样本量有关。 特别n=2,当两个点的连线不平行于横轴和纵轴时,r=1或r=-1。 样本相关系数大小不能直接评价两个变量之间的相关性。 通常研究者首先关心的是?=0 ? 相关系数的检验 总体相关系数?=0 时,样本相关系数一般不为0 (存在抽样误差),故需要作假设检验。 Pearson相关系数的假设检验要求X和Y服从双正态分布。 相关系数的检验 H0: ?=0 H1: ? ?0 ?=0.05 检验统计量 当?=0 为真时,t服从自由度为n-2的t分布,即|t|t0.05/2,n-2时,拒绝H0 : ?=0 可以认为两个变量呈线性相关(? ?0) 。 实例分析 H0: ?=0 H1: ? ?0 ?=0.05 临界值t0.05/2,15-2=2.16, |t| t0.05/2,15-2 故拒绝H0 : ?=0 ,可以认为凝血酶浓度y及凝血时间x呈线性负相关(? 0) 。 相关系数的95%可信区间计算 由于??0的样本相关系数r呈偏态分布,故需作z变换 ,方法如下: 其中 相关系数的95%可信区间计算 ?z?的95%可信区间为 反变换后?的95%可信区间为 实例?的95%可信区间计算 Z变换: ?z?的95%可信区间为 实例?的95%可信区间计算 Z的反变换 ?的下限为 ?的上限为 凝血酶浓度y及凝血时间x 的总体相关系数?的95%可信区间为(-0.976,-0.787) 线性相关与直线回归的异同性 线性相关与直线回归的异同性 回归系数? 刻画了X变化一个单位,Y平均变化多少单位,与相关性没有直接联系。即:回归系数可以很大,相关性可以很弱。 相关系数? 刻画了X与Y的相关程度,即:X与Y伴随变化的同步程度,但相关系数与X伴随Y同步变化幅度没有之间联系。即:回归系数可以很小, 但同步变化的一致程度很高(相关程度可以很强)。 直线相关分析对资料的要求 由概率论的条件概率公式,得到检验X和Y服从双正态分布的方法如下: 以X为自变量,Y为应变量作直线回归。 计算其残差 检验残差和自变量X是否均服从正态分布,并且残差与x没有明显的伴随趋势。 如果残差和X均服从正态分布且无伴随趋势,即可推断X和Y服从双正态分布。 直线回归与直线相关分析的注意点 直线回归的任何结果都不能推断x与Y的因果关系。 x与Y相关分析的结果不能推断为x与Y相等关系或两个变量的一致性。 一般而言,相关系数检验的无效假设为?=0,所以P和样本相关系数r的大小都不能推断总体相关系数?的大小,只有通过95%可信区间才能估计?的范围。 直线相关和直线回归小结 直线相关是刻画两个变量之间的相关程度。 直线回归是刻画自变量x与应变量Y的总体均数?y的线性对应关系。 在直线相关分析中,两个变量都是随机变量,且要求服从双正态分布。 直线相关和直线回归小结 在直线回归分析中,应变量Y是随机变量,x可以是非随机变量也可以是随机变量,但即使从研究背景上考察,x是随机变量,在直线回归模型,x的变量值视为普通变量的取值。 直线回归要求固定自变量x,Y服从正态分布或残差服从正态分布,并且自变量X与残差无明显的伴随变化趋势。 您对直线相关的要点理解吗? 直线相关描述了什么问题? 直线相关分析的具体步骤是什么? 直线相关分析对资料有什么要求? 如何对这些要求进行检查或检验? 仅用样

您可能关注的文档

文档评论(0)

ormition + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档