- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2007年统计学真题
2007年统计学真题
一、下面是一种零件误差的数据(档位:克):
6.1 4.7 6.5 6.2 7.7
6.4 5.5 7.1 6.1 5.3
5.7 6.1 5.3 4.0 4.8
3.2 3.9 1.9 4.9 3.8
5.3 2.6 5.3 5.5 5.8
2.7 6.8 7.4 5.6 3.3
根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。
请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法。
对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?
二、一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题。
如对这些员工进行随即电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?
抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?
这些员工的加班时间是否独立?如果不是,原因可能是什么?
三、某城市的交通管理部门的一项调查表明,该城市中自驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的看法,该研究机构准备抽取一个简单随机样本进行检验。
请写出检验的原假设和备择假设。
请对小样本情况写出计算p值的公式,并论述你所依赖的分布,对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要假定的条件.
对于一般检验来说,如果结果表明“统计上显著”不是实际上也显著?
四、在对某项产品认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%,那么该报告是否负责?一个负责任的调查报告,应该给出什么相关信息?
五、对于主成份析,有人在进行了主成份分析之后,对得到的主成份又进行了第二次主成份分析,以得到更加精确的结果,请问这样做是否有道理?请加以说明。什么样的数据不适宜主成份分析?选择那些主成份累积方差贡献率为70-80%之类的准则是不是总是适用?为什么?
六、回归模型y=β0 +β1X1 +β2X2+…+βpXp+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项做出假定?如果不是,那么在什么情况下需要对误差项做出假定?做什么假定?
七、对于聚类分析,请回答以下问题。
(1)分层聚类前,需要对什么进行选择。
(2)描述分层聚类分析的详细步骤
(3)描述K均值(快速)聚类分析的详细步骤。
八、应用多元线性回归模型y=β0 +β1X1 +β2X2+…+βpXp+ε,如果一个SPSS回归分析的结果如下表所示:
ANOVA
Model Sum of Squares Df Mean Square F Sig 1 Regression
Residual
Total 106831048750.124
31085446686.216
137916495436.340 1
472
473 106831048750.124217 1622.118 .000(a) 2 Regression
Residual
Total 111136313278.118
26780182158.221
137916495436.340 2
471
473 55568156639.059217 977.312 .000(b) a Predictors: (Constant),Beginning Salary
b Predictors: (Constant),Beginning Salary,Employment Category
则:
表中所用选择自变量的方法可能是什么?
表中的最后一个sig如何求得?意义是什么?
请给出该表最后一个F所表示的统计量服从F分布所需要假定的条件,并对该统计量服从F分布予以证明
2006年统计学真题
一、某银行为缩短顾客到银行办理业务的等待时间,准备采用两种排队方式进行实验:一种是所有顾客进入一个等待列队;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两
文档评论(0)