应用回归第三章课后答案摘要.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 多元线性回归 思考与练习参考答案 3.2 讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响? 答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:np。如果n=p对模型的参数估计会带来很严重的影响。因为: 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。 解释变量X是确定性变量,要求,表明设计矩阵X中的自变量列之间不相关,即矩阵X是一个满秩矩阵。若,则解释变量之间线性相关,是奇异阵,则的估计不稳定。 3.3证明 随机误差项ε的方差(2的无偏估计。 证明: 3.4 一个回归方程的复相关系数R=0.99,样本决定系数R2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。因为: 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。 样本决定系数和复相关系数接近于1只能说明Y与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F检验和t检验。 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R2的增大与拟合好坏无关。 3.7 验证 证明:多元线性回归方程模型的一般形式为: 其经验回归方程式为, 又, 故, 中心化后,则有, 左右同时除以, 令, 样本数据标准化的公式为 , 则上式可以记为 则有 3.10 验证决定系数R2与F值之间的关系式: 证明: 3.11 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9(略)。 (1)计算出y,x1,x2,x3的相关系数矩阵。 SPSS输出如下: 则相关系数矩阵为: (2)求出y与x1,x2,x3的三元回归方程。 对数据利用SPSS做线性回归,得到回归方程为 (3)对所求的方程作拟合优度检验。 由上表可知,调整后的决定系数为0.708,说明回归方程对样本观测值的拟合程度较好。 (4)对回归方程作显著性检验; 原假设: F统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得,由方查分析表得,F值=8.2834.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。 (5)对每一个回归系数作显著性检验; 做t检验:设原假设为, 统计量服从自由度为n-p-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.9421.943,处在否定域边缘。 X2的t值=2.4651.943。拒绝原假设。 由上表可得,在显著性水平时,只有的P值0.05,通过检验,即只有的回归系数较为显著 ;其余自变量的P值均大于0.05,即x1,x2的系数均不显著。 (6)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,并作回归方程的显著性检验和回归系数的显著性检验。 解:用后退法对数据重新做回归分析,结果如下: 选择模型二,重新建立的回归方程为: 对新的回归方程做显著性检验: 原假设: F服从自由度为(2,7)的F分布,给定显著性水平=0.05,查表得,由方差分析表得,F值=11.1174.74,p值=0.007,拒绝原假设. 认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。 对每一个回归系数做显著性检验: 做t检验:设原假设为,统计量服从自由度为n-p-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,X1的t值=2.5751.895,拒绝原假设。故显著不为零,自变量X1对因变量y的线性效果显著; 同理β2也通过检验。同时从回归系数显著性检验表可知:X1,X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。 (7)求出每一个回归系数的置信水平为955D 置信区间 由回归系数表可以看到,β1置信水平为95%的置信区间[0.381,8.970], β2置信水平为95%的置信区间[3.134,14.808] (8)求标准化回归方程 由回归系数表(上表)可得,标准化后的回归方程为: (9)求当x01=75,x02=42,x03=3.1时的y的预测值,给定置信水平95%,用SPSS软件计算精确置信区间,用手工计算近似预测区间; 由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预测区间为,手工计算得:(219.6,316

文档评论(0)

琼瑶文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档