多重线性回归分析.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
全局择优法 变量筛选 逐步选择法 分析Y身高与X1 体重(公斤)、 X2 体重(克);显然,此处的两个解释变量X1,X2实际上是1个变量,因为他们提供的信息完全相同,若进行相关分析,相关系数等于1,这种现象就叫自变量的共线性。 * 三、分析步骤 2.4.4 变量筛选方法的选择 究竟哪一种筛选变量的方法最好?这个问题没有绝对的定论。 一般来说,逐步回归法和最优回归子集法较好。对于一个给定的资料,可试用多种变量筛选的方法,结合以下几条判断原则,从中选择最佳者。 * 三、分析步骤 其一,拟合的回归方程在整体上有统计学意义; 其二,回归方程中各回归参数的估计值的假设检验结果都有统计学意义; 其三,回归方程中各回归参数的估计值的正负号与其后的变量在专业上的含义相吻合; 其四,根据回归方程计算出因变量的所有预测值在专业上都有意义。 其五,若有多个较好的多重线性回归方程时,残差平方和较小且多重线性回归方程中所含的自变量的个数又较少者为最佳。 * 三、分析步骤 2.5 模型拟合效果评价 2.5.1 决定系数(R2) 即复(全)相关系数的平方,其值等于因变量观测值与预测值之间简单相关系数的平方。计算公式为: * 三、分析步骤 2.5 模型拟合效果评价 2.5.1 决定系数(R2) R2取值介于0到1之间,其含义为自变量能够解释因变量y变异的百分比。 R2越接近于1,说明线性回归对实际数据的拟合程度越好。 * 三、分析步骤 2.5 模型拟合效果评价 2.5.2 校正决定系数(Rc2) 随着模型中自变量个数的增加,决定系数R2将不断增大,这不符合回归模型中自变量个数尽可能少的原则。 * 三、分析步骤 2.5 模型拟合效果评价 2.5.2 校正决定系数(Rc2) 故在评价两个包含不同个数自变量的回归模型的拟合效果时,不能简单地用决定系数作为评价标准。 此时,必须考虑回归模型中自变量个数的影响。 * 三、分析步骤 2.5 模型拟合效果评价 2.5.2 校正决定系数(Rc2) 构造校正决定系数,其公式为: 其中,n为样本含量,p为模型中自变量个数。决定系数相同时,自变量个数越多, Rc2越小。 * 三、分析步骤 2.5 模型拟合效果评价 2.5.3 AIC信息准则 该准则由日本学者赤池于1973年提出,广泛应用于时间序列分析中自回归阶数的确定,多重回归、广义线性回归中自变量的筛选以及非线性回归模型的比较和选优。该统计量取值越小,反映模型拟合效果越好。 在进行多重线性回归分析时,除了要满足LINE 外,还要求各变量之间不能存在共线性,即各变量之间要相互独立。为此,需要进行共线性诊断; 当自变量均为随机变量时,若它们之间高度相关,则称变量间存在多重共线性(multicollinearity);自变量之间不存在多重共线性,即称其互相独立。 三、分析步骤 2.6 共线性诊断 * 三、分析步骤 多重线性回归分析中,可能会出现以下问题: 回归方程的检验有统计学意义,而各偏回归系数的检验均无统计学意义。 偏回归系数的估计值大小或其符号与实际情况和专业知识相违背,难以解释。 某个(些)与因变量关系密切的自变量,因为参数标准误的估计值较大,相应t值就会变得较小,造成其偏回归系数无统计学意义。 * 三、分析步骤 导致这些问题的原因可能有: (1)研究设计不够合理; (2)资料收集存在问题; (3)自变量间近似线性; (4)数据中存在异常点; (5)样本少而自变量多。 * 三、分析步骤 何谓多重共线性? 自变量间的近似线性关系,即是多重共线性。 由于数据自身的特征,回归模型中的自变量之间或多或少地存在一些相关性,这违反了自变量间相互独立的假设条件,称为多重共

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档