12多重线性回归与相关范例.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
河北省省级精品课程 卫生统计学 课程负责人: 尹素凤 第12章 多重线性回归与相关 主讲人:武建辉 第十二章 多重线性回归与相关 第一节 多重线性回归的概念与统计描述 第二节 多重线性回归的假设检验 第三节 复相关系数与偏相关系数 第四节 自变量筛选 一、数据与模型 例12-1 某学校20名一年级女大学生体重(kg)、胸围(cm)、肩宽(cm)及肺活量(L)实测值如表12-1所示,试对影响女大学生肺活量的有关因素作多重回归分析。 此型资料有一个应变量与多个自变量(k个自变量)依存在关系,它的基本形式为 Y=?0+ ?1X1i+ ?2X2i+… ?kXki+?i。 ?0为回归方程的常数项, ?j为偏回归系数(PARTIAL REGRESSION COEFFICIEBT)相应的由样本估计而得的多重线性回归方程为: 因为k个自变量都具有各自的计量单位及不同的变异度,所以不能直接用普通偏回归系数的数值大小来反映各个自变量对反应变量Y的贡献大小。将原始观测数据进行标准化转换,即: 然后用标准化数据进行回归模型拟合,此时所获得的回归系数,记为P1,P2,P3,…,Pk,标准化偏回归系数(standardized partial regression coefficient)又称通径系数(path coefficient)。标准化偏回归系数Pi较大的自变量在数值上对反应变量Y的贡献较大。 ? 二、偏回归系数的估计 多元线性回归方程的建立(利用最小二乘法的原理) 虽然多重回归参数估计的原理和方法与简单回归分析相同,但是随着自变量个数的增加计算量变得相当大,一般依软件包来完成。对于本例的数据,经软件包计算可得回归方程: 第十三章 多重线性回归与相关 第一节 多元线性回归的概念与统计描述 第二节 多重线性回归的假设检验 第三节 复相关系数与偏相关系数 第四节 自变量筛选 一、整体回归效应的假设检验(方差分析) 表12-2 检验回归方程整体意义的方差分析表 19 4.738 总变异 0.081 16 1.302 残差 0.001 14.067 1.145 3 3.436 回归模型 P F MS df SS 变异来源 SS回它反应在Y的总变异中由于X与Y的直线关系而使Y变异减少的部分.它越大说明回归效果越好. SS剩它反应X对Y的线性影响之外的一切因素对Y的变异的作用.它越小,说明直线回归的估计误差越小. 二、偏回归系数?i的假设检验 1.假设 2.检验统计量 利用软件包对例12-1的三个偏回归系数进行t检验与标准化偏回归系数的结果如表12-3所示。 第十三章 多重线性回归与相关 第一节 多元线性回归的概念与统计描述 第二节 多重线性回归的假设检验 第三节 复相关系数与偏相关系数 第四节 自变量筛选 一、决定系数与复相关系数 回归平方和在总平方和中所占百分比称为确定系数(coefficient of determination),或决定系数,记为R2 ,用于反映线性回归模型能在多大程度上解释反应变量Y的变异性。定义为R2 =SSR/SST.它的取值范围为0-1之间。它越接近1,表示样本数据很好地拟合了所选用线性回归模型。 R2直接反映了回归方程中所有自变量解释反应变量Y总变异的百分比,或者说, R2也可以解释为回归方程使反应变量Y的总变异减少的百分比。 对总体确定系数R2=0的假设检验完全等价于对回归方程的整体方差分析,因为 对例13-1,由方差分析表可得:SSR=1773.343 SSE=651.958 SST=2425.301 R2=0.7312.由此说明,用包含这四个自变量的回归方程可解释脂联素变异性的78.74% 复相关系数(multiple correlation coefficient)R,定义为确定系数的算术平方根, 即 表示变量Y与k个自变量的线性相关的密切程度。 对本例R=0.8515。表示肺活量与三个自变量的复相关系数为0.8515。 调整决定系数(Adjusted R-Square) 当回归方程中包含有很多自变量,即使其中有一些自变量对解释反应变量变异的贡献极小,随回归方程自变量个数的增加,R2表现只增不减,这是决定系数的缺点。 调整决定系数记为R2?,定义为 二、偏相关系数 表12-4 冷饮销售量、游泳人数与气温数据 34 1369 655 39 2749 996 33 1253 618 38 2231 889 32 1066 528 37 1931 780 31

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档