网站大量收购闲置独家精品文档,联系QQ:2885784924

北京大学医学部医学统计学进阶1第1讲 多重线性回归与相关.ppt

北京大学医学部医学统计学进阶1第1讲 多重线性回归与相关.ppt

  1. 1、本文档共128页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
五、应用直线相关与回归的注意事项 (一)注意事项 1.考虑实际意义 进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来做相关回归分析。 2. 相关关系 相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系。 3. 利用散点图 对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。 4. 变量范围 相关分析和回归方程仅适用于样本的原始数据范围之内,超出了这个范围,我们不能得出两变量的相关关系和回归关系。 (二)相关与回归的区别 1. 意义 相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。 回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。 2. 应用 研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。 3. 性质 相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。 回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。 4. 相关系数r与回归系数b r与b的绝对值反映的意义不同。 r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。 b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。 (三)相关与回归的联系 1. 关系 能进行回归分析的变量之间存在相关关系。所以,对于两组新数据(两个变量)可先做散点图,求出它们的相关系数,对于确有相关关系的变量再进行回归分析,求出回归方程。 2. 相关系数r与回归系数b r与b的符号一致。r为正时,b也为正,表示两变量是正相关,是同向变化。r为负时,b也为负,表示两变量是负相关,是反向变化。 r与b的假设检验结果一致。对同一资料,可以证明r与b假设检验的统计量t值的大小相等,因而结果总是相同的。 由于对r进行假设检验的统计量t值计算公式比较简便,而且还可以直接查表。所以,可用r的显著检验代替b的显著性检验。 第二节 多重(多元)线性回归 在医学研究中,影响某个结局指标的因素常常有很多个,特别对于慢性非传染性疾病更是如此,例如心血管疾病、肿瘤等。 多重线性回归分析可以用来发现影响某个结局变量的多个因素,并有可能建立有效的预测模型。 一、多重线性回归模型 多重线性回归模型可视为简单直线模型的直接推广。简单的说,只有一个自变量的线性模型为简单直线回归模型,具有两个以上自变量的线性模型即为多重线性回归模型。 这里提及的回归模型中,都只有一个因变量。 总体回归模型: β0为常数项,β1 , … ,βm 称为总体偏回归系数。 样本回归模型: 偏回归系数: b0为常数项,b1,b2,…,bm为样本偏回归系数。 偏回归系数表示在其它所有自变量固定不变的情况下,某一个自变量变化一个单位时引起因变量y变化的平均大小。 残差e:y 的变化中不能为自变量所解释的部分。 线性回归的适用条件: 1.L:线性——自变量x与应变量y之间存在线性关系; 2.I:独立性——y值相互独立,在模型中则要求残差相互独立,不存在自相关; 3.N:正态性——随机误差(即残差)e服从均值为零,方差为?2的正态分布; 4. E:等方差—— 对于所有的自变量x,残差e的方差齐。 数据类型要求 因变量必须是数值型变量(连续变量)。 自变量既可以是数值型变量,也可以是分类型变量。但如果是多分类变量,则不能直接进入回归方程,而要先进行哑变量设置(略)。 例2. 某研究者测量了29名儿童血液中血红蛋白(g)、钙(μg)、镁(μg) 、铁(μg) 、锰(μg) 、铜(μg)的含量。试以血红蛋白为因变量,其它为自变量,建立回归模型。 做回归分析的第一步通常是做散点图,以发现因变量与自变量之间是否大致存在直线关系。如有明显的曲线关系,则不能直接做线性回归模型。 另外,散点图还有助于发现异常点。 采用最小二乘法(LS)估计回归系数b 即要求残差平方和: 达到最小值。 求解过程需要进行矩阵运算,并要借助计算机完成。 二、回归系数的估计 或写成: Y=XB+E 如矩阵X’X的逆存在,则回归系数矩阵B=(X’X)-1X’Y 所有样本点数据代入模型后可写成如下矩阵形式: SPSS回归分析

文档评论(0)

beoes + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档