- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 多元线性回归
思考与练习参考答案
3.2 讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?
答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:np。如果n=p对模型的参数估计会带来很严重的影响。因为:
在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。
解释变量X是确定性变量,要求,表明设计矩阵X中的自变量列之间不相关,即矩阵X是一个满秩矩阵。若,则解释变量之间线性相关,是奇异阵,则的估计不稳定。
3.3证明 随机误差项ε的方差(2的无偏估计。
证明:
3.4 一个回归方程的复相关系数R=0.99,样本决定系数R2=0.9801,我们能判断这个回归方程就很理想吗?
答:不能断定这个回归方程理想。因为:
在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。
样本决定系数和复相关系数接近于1只能说明Y与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F检验和t检验。
在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R2的增大与拟合好坏无关。
3.7 验证
证明:多元线性回归方程模型的一般形式为:
其经验回归方程式为,
又,
故,
中心化后,则有,
左右同时除以,
令,
样本数据标准化的公式为
,
则上式可以记为
则有
3.10 验证决定系数R2与F值之间的关系式:
证明:
3.11 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9(略)。
(1)计算出y,x1,x2,x3的相关系数矩阵。
SPSS输出如下:
则相关系数矩阵为:
(2)求出y与x1,x2,x3的三元回归方程。
对数据利用SPSS做线性回归,得到回归方程为
(3)对所求的方程作拟合优度检验。
由上表可知,调整后的决定系数为0.708,说明回归方程对样本观测值的拟合程度较好。
(4)对回归方程作显著性检验;
原假设:
F统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得,由方查分析表得,F值=8.2834.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。
(5)对每一个回归系数作显著性检验;
做t检验:设原假设为,
统计量服从自由度为n-p-1=6的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.9421.943,处在否定域边缘。
X2的t值=2.4651.943。拒绝原假设。
由上表可得,在显著性水平时,只有的P值0.05,通过检验,即只有的回归系数较为显著 ;其余自变量的P值均大于0.05,即x1,x2的系数均不显著。
(6)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,并作回归方程的显著性检验和回归系数的显著性检验。
解:用后退法对数据重新做回归分析,结果如下:
选择模型二,重新建立的回归方程为:
对新的回归方程做显著性检验:
原假设:
F服从自由度为(2,7)的F分布,给定显著性水平=0.05,查表得,由方差分析表得,F值=11.1174.74,p值=0.007,拒绝原假设.
认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。
对每一个回归系数做显著性检验:
做t检验:设原假设为,统计量服从自由度为n-p-1=7的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,X1的t值=2.5751.895,拒绝原假设。故显著不为零,自变量X1对因变量y的线性效果显著;
同理β2也通过检验。同时从回归系数显著性检验表可知:X1,X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。
(7)求出每一个回归系数的置信水平为955D 置信区间
由回归系数表可以看到,β1置信水平为95%的置信区间[0.381,8.970],
β2置信水平为95%的置信区间[3.134,14.808]
(8)求标准化回归方程
由回归系数表(上表)可得,标准化后的回归方程为:
(9)求当x01=75,x02=42,x03=3.1时的y的预测值,给定置信水平95%,用SPSS软件计算精确置信区间,用手工计算近似预测区间;
由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预测区间为,手工计算得:(219.6,316
文档评论(0)