网站大量收购独家精品文档,联系QQ:2885784924

多重线性回归分析.pptVIP

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

三、分析步骤*共线性诊断条件数设X为n个研究对象在k个自变量上的取值数据矩阵,则可求出其交叉乘积矩阵X′X的k个特征根,记为li(i=1、2、…、k),且有l1l2…lk。三、分析步骤*共线性诊断条件数最大特征根与其余每个特征根比值的平方根,称为条件指数(conditionalnumber),公式为:12三、分析步骤*共线性诊断01条件数而最大条件指数,简称为条件数,其值为最大特征根与最小特征根之比值的平方根。即:02三、分析步骤*共线性诊断条件数条件数越大,说明设计矩阵X具有越强的共线性。经验上,若0CNk10,可认为自变量间不存在多重共线性;若10≤CNk≤30,可认为自变量间存在中等程度的多重共线性;若CNk30,则认为自变量间存在严重的多重共线性。三、分析步骤*共线性诊断方差分量SAS软件在给出条件数的同时,还会给出每个主成分变量分得的方差,即方差分量,SAS输出结果时的标志是“VarProp”。三、分析步骤*共线性诊断方差分量若条件数(即最大条件指数)大于10,且所在行同时有两个以上的变量方差分量超过0.5,就意味着这些变量间存在一定程度的相关。三、分析步骤*共线性诊断共线性的解决方法变量筛选采用自变量筛选的方法一般可选出对因变量有统计学影响且相互之间独立或相关性较低的一组自变量。12三、分析步骤*共线性诊断共线性的解决方法有偏估计自变量间存在多重共线性且专业上认为需要保留在模型中时,不宜使用最小二乘法估计模型。此时,可采用有偏估计。此类方法包括岭回归分析、主成分回归分析等。三、分析步骤*共线性诊断共线性的解决方法增大样本含量通过增加样本含量,减少估计量的方差,提高估计精度,可在一定程度上克服多重共线性。12三、分析步骤*具体步骤2.4变量筛选这就是自变量的选择问题,或称为变量筛选。选择时,一要尽可能地不漏掉重要的自变量;二要尽可能地减少自变量的个数,保持模型的精简。三、分析步骤*具体步骤2.4变量筛选就回归方程而言,每个变量均有两种可能性,即被选择或被踢除。所以,所有可能的模型有2k个(k为自变量个数)。自变量个数较多时,计算量过大。此时,需要一定的变量筛选方法。三、分析步骤*2.具体步骤2.4变量筛选常用的变量筛选方法有以下8种:前进法后退法逐步回归法最大R2增量法最小R2增量法R2选择法修正R2选择法Mallow’sCp选择法2.4.1前进法(FORWARD)三、分析步骤*01回归方程中变量从无到有依次选择一个自变量进入回归方程,并根据该变量在回归方程中的Ⅱ型离差平方和(SS2)计算F统计量及P值。02当P小于sle(规定的选变量进入方程的临界水平)则该变量入选,否则不能入选。三、分析步骤*2.4.1前进法当回归方程中变量少时某变量不符合入选标准,但随着回归方程中变量逐次增多时,该变量就可能符合入选标准;这样直到没有变量可入选为止。具体而言,是从仅含常数项(即截距项)的最简单模型开始,逐步在模型中添加自变量。三、分析步骤*2.4.1前进法01局限性:02sle取值小时,可能没有一个变量能入选;03sle取值大时,开始选入的变量后来在新条件下不再进行检验,因而不能剔除后来变得无统计学意义的变量。04三、分析步骤*2.4.2后退法(BACKWARD)从模型中包含全部自变量开始,计算留在回归方程中的各个自变量所产生的F统计量和P值,当P值小于sls(规定的从方程中踢除变量的临界水准)则将此变量保留在方程中。三、分析步骤*2.4.2后退法否则,从最大的P值所对应的自变量开始逐一踢除,直到回归方程中没有变量可以被踢除时为止。三、分析步骤*sls大时,任何一个自变量都不能被踢除;2.4.2后退法局限性:sls小时,开始被踢除的自变量后来在新条件下即使变得对因变量有较大的贡献了,也不能再次被选入回归方程并参与检验。三、分析步骤*0302012.4.3逐步回归法(STEPWISE)此法是前进法和后退法的结合。回归方程中的变量从无到有像前进法那样,根据F统计量和P值大小按sle水平决定该自变量是否入选。三、分析步骤*2.4

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档