- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可编辑版
Word完美格式
应用回归分析简答题及答案
4.为什么要对回归模型进行检验?
答:当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用他来研究经济问题,但如果马上就用这个模型去做预测、控制和分析,显然是不够慎重的。因为这个模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。
5.讨论样本容量n与自变量个数p的关系,他们对模型的参数估计有何影响?
答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:np。如果n=p对模型的参数估计会带来严重的影响。
因为:(1)在多元线性回归模型中,有p+1个待估参数B,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。
(2)解释变量X是确定性变量,要求rank(X)=p+1n,表明设计矩阵X中的自变量列之间不相关,样本容量的个数应该大于解释变量的个数,X是一个满秩矩阵。
7.如何正确理解回归方程显著性检验拒绝Ho,接受Ho?
答:(1)一般情况下,当Ho:B1=0被接受时,表明y的取值倾向不随x的值按线性关系变化,这种状况的原因可能是变量y与x之间的相关关系不显著,也可能虽然变量y与x之间的相关关系显著,但这种相关关系不是线性的而是非线性的。
(2)当Ho:B1=0被拒绝时,没有其他信息,只能认为因变量y对自变量x是有效的,但并没有说明回归的有效程度,不能断言y与x之间就一定是线性相关关系,而不是曲线关系或其他的关系。
8.一个回归方程的复相关系数R=0.99,样本决定系数R^2=0.9801,我们能断定这个回归方程就很理想吗?
答:1.在样本容量较少,变两个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。
2.样本决定系数和复相关系数接近1只能说明Y与自变量X1,X2,…,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量都是显著的,还需进行F检验和t检验。
3.在应用过程中发现,在样本量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得R^2增大,因此增加解释变量个数引起的R^2的增大与拟合好坏无关。
9.数据中心化和标准化在回归分析中的意义是什么?
答:原始数据由于自变量的单位不同,会给分析带来一定的困难;又由于涉及的数据量较大,可能会以为舍入误差而使得计算结果并不理想。中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。
10.试举例说明产生异方差的原因。
答:由于实际问题是错综复杂的,因而在建立实际问题的回归模型时,经常会出现某一些因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。引起异方差的原因很多,担当样本数据为截面数据时容易出现异方差。
例如:烟具城镇居民收入与购买量的关系:Yi=Bo+B1Xi+Ei,i=1,2,···,n
其中:Yi表示第i户的消费额,Xi表示第i户的收入量
由于低收入的家庭购买差异性比较小,大都购买生活必需品,但高收入的家庭购买行为差异很大,所以随即项Ei具有不同的方差。
11.异方差性带来的后果是什么?
答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。
12.简述用加权最小二乘法消除线性回归中异方差性的思想与方法。
答:思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。在异方差的条件下,平方和中的每一项的地位不同,误差项方差大的项,在平方和中作用大,回归线被拉向方差大的项。加权最小二乘法是在平方和中加入一个适当的权数Wi,以调整各项在平方和中的作用。
方法:加权最小二乘法、BOX-COX变换法、方差稳定性变换法。
13.试举一可能产生随机误差项序列相关的例子。
答:例如,居民消费函数的模型:Ct=Bo+B1Yt+Et,t=1,2,```,n
由于居民收入对消费影响有滞后性,而且今年消费水平受上年消费水平影响,则可能出现序列相关性。另外由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。
14.序列相关性带来的严重后果是什么?
答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。
15.说明引起异常值的原因和消除异常值的方法。
答:原因:
1.数据登记误差,存在抄写或录入的错误;
2.数据测量误差;
3.数据随机误差;
4.缺少重要自变量;
5.缺少观测数据;
6.存在异方差;
7.模型选用错误,线性模型不适用。
方法:1.重新核实数据;
2.重新测量数据;
3.删除或重新
文档评论(0)