多元线性回归参考.ppt

  1. 1、本文档共213页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归参考

* 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 (2)增大样本容量 建立一个实际经济问题的回归模型,如果所收集的样本数据太少,也容易产生多重共线性。增大样本容量也是消除多重共线性的一个途径 。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 在实践中,当我们所选的变量个数接近样本容量n时,自变量间就容易产生共线性。所以我们在运用回归分析研究经济问题时,要尽可能使样本容量n远大于自变量个数p。 增大样本容量的方法在有些经济问题中是不现实的,因为在经济问题中,许多自变量是不受控制的,或由于种种原因不可能再得到一些新的样本数据。在有些情况下,虽然可以增大一些样本数据,但自变量个数较多时,我们往往难以确定增加什么样的数据,才能克服多重共线性。 有时,增加了样本数据,但可能新数据距离原来样本数据的平均值较大,会产生一些新的问题,使模型拟合变差,没有收到增加样本数据期望的效果。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 (3)回归系数的有偏估计 消除多重共线性对回归模型的影响是近40年来统计学家们关注的热点课题之一,除以上方法被人们应用外,统计学家还致力于改进古典的最小二乘法,提出以采用有偏估计为代价来提高估计量稳定性的方法,如岭回归法,主成分法,偏最小二乘法等,这些方法已有不少应用效果很好的经济例子,而且在计算机如此发达的今天,具体计算也不难实现。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.4 异常值与强影响值 在回归分析的应用中,数据时常包含着一些异常的或极端的观察值,这些观察值与其他数据远远分开,可能引起较大的残差,极大地影响回归拟合的效果。在一元回归的情况下,用散点图或残差图就可以方便地识别出异常值,而在多元回归的情况下,用简单画图法识别异常值就很困难,需要更有效的方法。 异常值分为两种情况,一种是关于因变量y异常,另一种是关于自变量x异常。以下分别讨论着两种情况。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.4 异常值与强影响值 一、关于因变量y的异常值 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.4 异常值与强影响值 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 一、多重共线性产生的背景 解释变量之间完全不相关的情形是非常少见的,尤其是研究某个经济问题时,涉及的自变量较多,我们很难找到一组自变量,它们之间互不相关,而且它们又都对因变量有显著影响。这样的一组自变量甚至是找不到的。客观地说,某一经济现象,涉及到多个影响因素时,这多个影响因素之间大都有一定的相关性。当它们之间的相关性较弱时,我们一般就认为符合多元线性回归模型设计矩阵的要求;当这一组变量间有较强的相关性时,我们就认为是一种违背多元线性回归模型基本假设的情形。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 当我们所研究的经济问题涉及到时间序列资料时,由于经济变量随时间往往存在共同的变化趋势,使得它们之间就容易出现共线性。 例如,我国近年来的经济增长态势很好,经济增长对各种经济现象都产生影响,使得多种经济指标相互密切关联。如果我们要研究我国居民消费状况,影响居民消费的因素很多,一般有职工平均工资、农民平均收入、银行利率、全国零售物价指数、国债利率、货币发行量、储蓄额、前期消费额等,这些因素显然既对居民消费产生重要影响,它们之间又有着很强的相关性。 目录 上页 下页 返回 结束 * 中国人民大学六西格玛质量管理研究中心 * §6.3 关于多重共线性问题 对于许多利用截面数据建立回归方程的问题常常也存在自变量高度相关的情形。例如,我们以

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档