- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人大统计学考研
历年真题参考解答
(03-09)
2009年人大统计学专业课初试题参考解答
一、设第一、二个总体均值分别为与,样本均值分别为与,样本方差分别为与。
1.构造原假设和备择假设
2.构造统计量。由于两总体方差相等,且均为正态总体,则可以构造如下检验统计量:
其中
则
3.计算临界值。给定显著性水平,如,计算临界值,由于5030,则。
4.做出决策。由于,故拒绝原假设,即认为。
二、1.对于回归模型,的最小二乘估计为:。现在来看它的期望
从上面可以看出,要使为无偏估计,则必须满足,所以只有当时,才为有偏估计。
2.使的原因:
①遗漏了关键自变量,即全模型正确时,而我们误用了选模型。用选模型建模时,使得误差项中含有遗漏自变量的信息,从而期望不为零。证明过程如下
证明:假设正确模型为,令,。而我们选用了模型来估计,得到,则
从上式可以看出是的有偏估计。
②加入了无关紧要的自变量,即选模型正确,而我们误用了全模型,这样会过度提取误差项信息,使得估计量有偏。证明过程和上式差不多。这里省略。
3.解决办法:在选择自变量时,对因变量有重要影响的自变量尽量考虑全面,但自变量又不是越多越好,应该去掉那些对因变量没有影响或者影响很小的自变量。具体实施办法有前进法、后退法、逐步回归法等。
三、是平稳过程,证明如下
即协方差函数只与有关。
由平稳过程的定义知,题中所定义的过程为平稳过程。
四、1.先来估计各层总体的方差。在比例估计中定义
则可得如下关于总体方差的式子
从上式我们可以估计出各层的方差
(由于很大,故省略系数。)
2.考虑样本容量为600的简单随机抽样的方差。在简单随机抽样下总体比例的估计量为
估计量方差的估计值为
3.考虑奈曼分配的情形。设抽取的样本容量为,样本量在各层的分配公式为
代入数据得到
则奈曼分配的估计量方差的估计为
4.计算。要使奈曼分层抽样与简单随机抽样有相同估计量方差,则必须满足
即
解得
五、略。
六、1.来看的性质
由上可看出,该模型违背古典线性回归模型的方差一致性假设,残差存在异方差性。
2.加权最小二乘法。当残差存在异方差时,如果还是用最小二乘法估计参数,会带来严重的后果,如下
①参数估计值虽是无偏的,但不是最小方差线性无偏估计;
②参数的显著性检验失效;
③回归方差的应用效果极不理想。
鉴于此,我们必须寻求适当的方法对原来的估计方法进行变换,使变换后的估计方法满足同方差性假设。由于异方差性导致离差平方和
中的各项的比重不一样,地位不平等,导致使用普通最小二乘法时,回归线就被拉向方差大的项。而在此题中,残差系列与自变量观测值的平方成正比,即
因此当我们在平方和各项前面加入一个权重时,各项的地位就平等了。从而克服了普通最小二乘法的弊端,这就是加权最小二乘法。它实施起来简单,原理清晰,是解决本题最好的方法。
七、1.数据分析。在本题中有三个影响因素:时间、活动空间、安眠药。因变量是老鼠的活动状态,可以把它看成数值型变量。要研究的是时间、活动空间、安眠药对老鼠活动状态是否有显著的影响。我的分析思路是:
首先,我把数据列成如下的表格
吃药后立即记录的数据
吃药 不吃药 关在一起 分开喂养
吃药后一小时记录的数据
吃药 不吃药 关在一起 分开喂养
吃药后两小时记录的数据
吃药 不吃药 关在一起 分开喂养 其中表示老鼠的编号,每个组有10只老鼠。代表时间。
其次,对每个表格的数据进行有交互作用的方差分析,通过分析得到活动空间、安眠药是否对老鼠活动状态有显著的影响,也可得到它们的交互作用是否对老鼠活动状态有显著的影响。通过在三个观测时间上各自的分析,最后得到安眠药在那个时间点上的效果最好。
2.分析步骤。(和第八题的步骤差不多,这里就不写了。)
注:上述问题属于有重复测量的方差分析问题,它与一般方差分析的不同之处在于它的时间观测值数据之间不是独立的、是相关的。这里将时间分开来处理,似乎有所不妥,特此说明,仅供参考。
八、1.本题中职称和性别都是属性变量,满意度是数值型变量,要研究属性变量对数值型的影响,很自然会想到用方差分析方法,而本题中我们用无交互作用的双因素方差分析方法。
①问题提出:在分析一个属性变量对一个数值型变量的影响时,我们把属性变量的各个水平各看成一个总体,然后比较这几个总体的均值,看它们是否有显著的差异,如果有显著的差异,则说明在各个水平下得到的数据之间是有差异的,即认为属性变量对数值型变量有显著影响。在本题中,比如我们要研究性别对满意度有无显著影响,我们的思路是把男、女两个水平各看成一个总体,然后根据数据设计一种方法检验它们的均值有无显著的差异,如果没有差异,那么我们认为两总体
文档评论(0)