[医学]第十四讲 多元回归 卫生统计学.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[医学]第十四讲 多元回归 卫生统计学

第13章 多重线性回归与相关 第一节?? 多重线性回归的概念与统计推断 第二节 假设检验及其评价 第三节 复相关系数与偏相关系数 第四节????自变量筛选 第五节 多元线性回归的应用与注意事项 一、概念 变量:应变量 1 个,自变量k 个,共 k+1 个。 样本含量:n 数据格式:见表13-1 回归模型一般形式: 意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。 目的:作出以多个自变量估计应变量的多元线性回归方程。 资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。 用途:解释和预报更精确。 例 题 例13-1 为研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定了30名患者的体重指数BMI(kg/m2)、病程DY(年)、瘦素LEP(ng/ml)、空腹血糖FPG(mmol/L)及脂联素ADI(ng/ml)水平,数据如表13-1所示。试进行回归分析。 三、多元线性回归分析的步骤 第二节 假设检验及其评价 二、偏回归系数的t检验 利用SAS对例13-1的四个偏回归系数进行t检验标准化偏回归系数的结果如表13-3所示。 三、标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。 注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,Xj增加或减少一个单位时Y的平均变化量 。不能用各|bj |来比较各Xj对 的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大小, |bj |越大, Xj对 的影响越大。 复相关系数(R),衡量因变量Y与回归方程内所有自变量线性组合件相关关系的密切程度。 0≤R≤1,没有负值。 R的值越接近1,说明相关关系越密切;越接近0说明相关关系越弱。 3、调整的R2(Adjusted R-Square) 当回归方程中包含有很多自变量,即使其中有一些自变量(如本例中的X2 )对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R2 值表现为只增不减,这是复相关系数R2的缺点。调整的R2定义为: 二、偏相关系数 偏相关系数(partial correlation coefficient ): 一般地,扣除其他变量的影响后,变量Y与X的相关。 第四节????自变量筛选 一、自变量筛选的标准与原则 1.残差平方和(SSE)缩小与确定系数(R2)增大 2.残差均方( SSE )缩小与调整确定系数增大 3. CP统计量 选择既具有较小CP值,在图中又接近于CP =p+1直线的模型作为“最优”的准则 二、多元线性回归应用的注意事项 1、非同质资料的合并问题 斜率相同(同质):可以利用男、女合并的资料拟合共同的回归模型; 不同质:此时应按不同性别分别拟合回归模型。 2、变量的数量化 名义分类变量的哑变量化 举 例 3、样本含量: n (样本含量)=(5~10)m(变量数)。 4、关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。 5、多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值变得很小。 (2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。 表13-5 脂联素水平与各自变量的相关系数和偏相关系数 偏相关系数 简单相关系数 0.788 0.001 0.954 0.001 简单相关系数P值 0.208 -0.25050 -0.05130 空腹血糖X4 0.004 -0.54012 -0.81053 瘦素X3 0.538 -0.12400 0.01098 病程X2 0.064 -0.36200 -0.77580 体重指数X1 偏相关系数P值 系数值 系数值 自变量 目的:使得预报和(或)解释效果好。

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档