网站大量收购独家精品文档,联系QQ:2885784924

现代统计方法多元回归spss软件实际的操作过程全解.docVIP

现代统计方法多元回归spss软件实际的操作过程全解.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九部分 多元线性回归 一、多元线性回归模型 1. 多元线性理论回归模型的一般形式 对组试验数据,,,上式可写成方程组形式 写成矩阵形式为 其中 =,=,=,=。 2. 基本假设条件 (1) rank=,该假设条件的成立说明自变量不相关 (2) 违反(1)称为多重共线性,违反(2)称为序列相关和异方差。我们将在后面内容的讨论不满足条件的处理办法。 (3) 二、回归参数的估计-普通最小二乘估计 求的估计值,使 根据多元函数极值原理, 当存在时,得回归参数 而得拟合方程 可以证明,是的无偏估计。另外,回归系数的求解应假定存在,因此,应有rank,即rank,所以有基本假设。 三、多元回归的显著性检验 多元回归的显著性检验包括回归方程的显著性检验和回归系数的显著性检验,两者既有相同之处,也有不同之处。 1.回归方程显著性的检验 多元回归方程的显著性检验就是看自变量从整体上对随机变量是否有显著的影响,而提出假设 如果被接受,则表明随机变量与自变量之间的关系由线性回归模型表示不合适。 同一元回归讨论类似,有平方和分解公式 =+ 简写为 在正态假设下,当成立时,统计量 对给定的检验水平,检验规则为: 当时,拒绝,否则就接受. 2.回归系数显著性的检验 在多元线性回归中,虽然通过了回归方程的显著性检验(拒绝),但并不意味着每个自变量对的影响都是显著的,因此要对每个自变量进行显著性检验。而提出假设 , 如果被接受,则表明自变量对随机变量的影响不显著;如果被拒绝,则表明自变量对随机变量的影响时显著的。 由,记=,则,,因此,在假设成立下, 对给定的检验水平,检验规则为: 当时,拒绝,否则就接受。 尽管回归方程通过了显著性检验,但也会出现某个自变量(甚至于每个自变量)对随机变量的影响不显著的情况; 在实际问题中可以删除一些不显著的变量(逐步回归),从而简化而突出主要变量; 例1 本例研究第三产业对旅游外汇收入的影响。《中国统计年鉴》把第三产业划分为12个组成部分,分别为农林牧渔服务业,地质勘查水利管理业,交通运输仓储和邮电通信业,批发零售贸易和餐饮业,金融保险业,房地产业,社会服务业,卫生体育和社会福利业,教育文化艺术和广播,科学研究和综合艺术,党政机关,其他行业。国际旅游外汇收入(百万美元),自变量单位为亿元人民币。 执行SPSS操作得回归方程为 由Anova表可以看到通过了检验(12个自变量作为一个整体对因变量影响显著)。 由系数表可以看到12个自变量都没有通过检验。 四、数据处理的基本方法 1. 数据标准化 对样本数据,,记 , 称,,为标准化后的数据。其中为变量对应的样本数据的样本方差,为变量对应的样本数据的样本方差。有时记,,称为样本离差。 2.标准化回归系数 对拟合回归方程,由于,两式相减得中心化回归方程 再除以,整理得标准化回归方程 其中,, 例1的标准化回归方程为 普通最小二乘估计表示在其他变量不变下,自变量的每单位绝对变化引起的因变量均值的绝对变化量,而则表示自变量的每单位相对变化(1%)引起的因变量均值的相对变化量的百分比。 3.总结 普通最小二乘估计的系数不具有可比性,如 。用标准化回归系数解释变量的相对重要性就比较理想了,但要注意的是,当变量之间具有相关性时,会影响标准化回归系数的大小。 五、相关系数与决定系数 1.简单相关系数 在一元线性回归中,定义与的样本相关系数为 及样本决定系数,并有 因此,样本决定系数反映了与的相关关系,且越接近1,表示回归拟合效果越好, 如可解释为,因为的变化而引起的90%的变化,另10%的变化是由其他因素引起的,或叙述为解释了的90%的变差。 类似于上面定义,可定义任意变量与的简单相关系数和决定系数及变量与的简单相关系数和决定系数 2.复相关系数 在多元线性回归中,类似定义与的样本复决定系数为 模型汇总 模型 R R 方 调整 R 方 标准 估计误差 1 .935a .875 .792 304.680 及样本复相关系数为 复相关系数反映了与一组变量的相关关系。例1的。 实际问题中,当然越接近1越好,但有时顾及到模型结构的合理解释,能在0.7左右也是可以接受的,当样本容量与自变量的个数接近时,很容易接近1,因此不能仅以的大小来决定模型的优劣。 例2 在建立建筑业降低成本率对流动资金、固定资金、优良品率、竣工面积、劳动生产率和施工产值的关系时,利用数据进行回归。从输出结果中可以看出,虽然,但方程没有通过检验()。 六

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档