暨南大学研究生课程医学统计学15-多元线性回归.ppt

暨南大学研究生课程医学统计学15-多元线性回归.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
暨南大学研究生课程医学统计学15-多元线性回归

第十五章 多元线性回归 暨南大学医学院医学统计教研室 林汉生 教学要求 掌握多元线性回归模型的一般形式 熟悉多元线性回归方程的假设检验及其评价方法 掌握用SPSS统计软件进行多元线性回归分析 熟悉多元线性回归方程的应用及其注意事项 教学内容 多元线型回归 自变量选择方法 多元线性回归的应用及其注意事项 问题的提出 直线回归分析是分析一个应变量Y和一个自变量X之间的数量关系。但通常一个应变量受到许多因素的影响。如: 糖尿病患者的血糖可能受胰岛素、糖化血红蛋白、血清胆固醇、甘油三酯等指标影响。 儿童血液中血红蛋白(Y)与微量元素:钙(X1),铁(X2)含量的关系。 第一节 多元线性回归 多元线性回归模型 多元线性回归方程的建立 多元线性回归方程的假设检验及其评价 一、多元线性回归模型 Y为应变量,X1,X2,…,Xm为k个自变量。 b0 :常数项 b1, b2,…, bk为偏回归系数的估计值 它表示在其它自变量固定不变的情况下,xj每改变一个单位时,单独引起的应变量Y的平均改变量。 :应变量的估计值 二、多元线性回归方程的建立 设有n例观察对象, 对第i例可求出应变量yi的估计值 i ,则 ,全部n例资料的残差平方和为: 全部n例资料残差平方和最小的那一组值就是要求的参数估计值。 表15-2 27名糖尿病人的血糖及 有关变量的测定结果 三、多元线性回归方程的 假设检验及其评价 回归方程的假设检验及评价:从总体上分析所有自变量对因变量Y是否有线性回归关系。 各自变量的假设检验与评价 = 5.94 + 0.142x1+0.351x2-0.271x3+0.638x4 (一)回归方程的假设检验及评价 方差分析法 决定系数R2 复相关系数 1. 方差分析法 H0:?1= ?2 = …?p =0 H1:各?j 不全为0 ?=0.05 F0.01(4,22)=4.31。本例F=8.28,P0.01。认为所拟合的回归方程具有统计学意义。 决定系数R2 coefficient of determination 说明自变量X1,X2,…,Xm能够解释Y变化的百分比,其值愈接近于1说明模型对数据的拟合程度愈好。 本例R2为0.60,表明血糖含量变异的60%可由总胆固醇、甘油三酯、胰岛素和糖化血红蛋白的变化来解释。 决定系数R2与校正决定系数R2adj 若引入模型的自变量与应变量没有任何关系或贡献很小,则校正决定系数比决定系数小。 若引入模型的自变量与应变量有关系或贡献很大,则两个决定系数接近。 3. 复相关系数 (multiple correlation coefficient) 度量应变量Y与多个自变量间的线性相关程度,亦即观察值Y与估计值 之间的相关程度。本例复相关系数 如果只有一个自变量时,R=|r|, r为简单相关系数。取值范围0≤R≤1。 (二)各自变量的假设检验与评价 使回归方程中只包含对应变量有统计学意义的自变量。 偏回归平方和(不介绍) t 检验法:与偏回归平方和检验完全等价。当回归方程有显著性时,对每个自变量的偏回归系数进行假设检验,当某个自变量的偏回归系数无显著性,则应把该变量剔除,重新建立不包含该自变量的多元线性回归方程。 H0:?j= 0 H1: ?j≠ 0 ?=0.05 t(bj)=bj / S(bj) 服从t(n-p-1)分布 本例,t(b1)=0.39, t(b2)=1.72, t(b3)=2.23, t(b4)=2.62 t0.05 /2,22=2.074, 即胰岛素和糖化血红蛋白对血红蛋白的线性回归有统计学意义;而总胆固醇和甘油三酯对血红蛋白的线性回归无统计学意义。 标准化回归系数 Standardized coefficient 当比较各自变量对因变量的相对贡献大小时,但由于各自变量的测量单位不同,单从各偏回归系数的绝对值大小评价不妥。 必须对各偏回归系数进行标准化处理,即消除测量单位的影响后,才能进行比较。 消除测量单位影响后的偏回归系数称为标准化偏回归系数。 第二节 自变量选择方法 在多元线性回归分析时,希望能从众多的自变量中: 挑选出对因变量有重要影响的变量 剔除对因变量没有影响或影响很小的变量,或与其他自变量相关密切的变量。 一、SPSS筛选变量的方法 向后剔除法 向前引入法 逐步筛选法 其他 1. 向后剔除法 (backward selection) 先建立一个包含全部自变量的回归方程,然后每次剔除一个对因变量作用最小且无统计学意义的自变量,直到不能剔除为止。当两个变量一起

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档