12 回归分析2013卫生统计学幻灯片.pptVIP

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一节 多重线性回归的概念及其统计描述 线性回归与相关 一、多重回归分析数据格式 一、多重线性回归模型的一般形式 第二节、多重线性回归方程的 假设检验 1、回归方程的方差分析 (所有回归系数为0) 有关计算公式 2、有关评价指标 软件有关结果 (1).残差标准差( Root MSE ) (2).决定系数 ( determination coefficient) 决定系数 含义:被解释变量所解释的部分占总体离差的大小。越大越好,但是不会超过1。 缺点:如果在模型中增加一个解释变量,模型的解释功能增强了, 就增大了。这就给人一个错觉:要使得模型拟合得好,就必须增加解释变量。 (3).校正的决定系数 ( Adjusted determination coefficient) 校正的决定系数 (三)、各自变量贡献大小的 假设检验及其评价 1、各回归系数的t检验 2、标准化回归系数 3、偏回归平方和 (sum of squares for partial regression)及其F检验 1.复相关系数 ( multiple correlation coefficient) 复相关系数与简单相关系数的区别是简单相关系数的取值范围是[-1,1],而复相关系数的取值范围是[0,1]。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。 2、偏相关系数 几个相关系数的区别 第四节 自变量的选择 一、全局择优法 (一) Cp准则的计算公式 (二) AIC准则的计算公式 应用以上准则如何选择模型? SAS获得的几个准则值结果 全局择优法的局限性 二、逐步法 (一)前进法 (二)后退法 (三)逐步回归法 例12-1(逐步选择法)结果(令α入=α出=0.10) 逐步回归法实例(令α入=α出=0.10) 逐步回归法实例(第一步) 逐步回归法实例(第二步) 逐步回归法实例(X1剔除否) 逐步回归法实例(第三步) 逐步回归法实例(X4/X1/X3剔除否) 逐步回归法实例(第四步) 逐步回归法实例(是否剔除) 逐步回归法实例(是否剔除) 例12-3的方差分析结果 例12-3的回归系数及其检验 第五节 多元线性回归的应用及其注意事项 一、应用 二、应用条件 三、应用的注意事项 (一)变量的数量化 名义分类变量的哑变量化 (二)样本含量 (三)统计“最优”与专业的“最优” (四)多重共线性 多重共线性的识别与解决办法 (五)交互作用 (六)残差分析(检验应用条件) (六)(用标准化残差发现异常点) 多重回归计算程序 假如职业分类为工、农、商、学、兵5类,则可定义比分类数少1个,即4个哑变量。编码方法如下: 观察个体数n与变量个数m的比例一般至少应为: n : m=5~10 不同准则、方法得出的“最优”方程不同; 不同的引入、剔除标准获得的“最优”方程不同; 方程还受数据的正确性、共线性影响 自变量间存在着线性关系,使一个或几个自变量可以由另外的自变量线性表示时,称为该变量与另外的自变量间存在有共线性(collinearity)。 回归系数的符号与由专业知识不符 变量的重要性与专业不符 0.395* 0.714* x3(肩宽) 0.503* 0.516* X2(胸围) 0.596* 0.698* X1(体重) 偏相关系数 简单相关系数 自变量 2、偏相关系数 在其他自变量保持不变条件下,某一因素与反应变 量之间的相关性。 1. 变量多增加了模型的复杂度 2. 计算量增大 3. 估计和预测的精度下降 4. 模型应用费用增加 根据一些准则(criterion)建立 “最优”回归模型 校正决定系数(考虑了自变量的个数) Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近(p+1)模型为最优) AIC(Akaike’s Information Criterion)准则; AIC越小越好 0.049 0.036 0.061 -4.715 0.081 4.000 0.674 0.725 7 0.099 0.029 -2.853 0.119 10.826 0.523 0.573 6 0.076 0.054 -2.476 0.103 7.417 0.589 0.632 5 0.046 0.081 -4.908 0.091 4.952 0.636 0.674 4 0.055 -1.545 0.193 26.732 0.225 0.266 3 0.088 -1.603 0.135 13.839 0.459 0

文档评论(0)

mkt361 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档