2007年统计学真题.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2007年统计学真题

2007年统计学真题 一、下面是一种零件误差的数据(档位:克): 6.1 4.7 6.5 6.2 7.7 6.4 5.5 7.1 6.1 5.3 5.7 6.1 5.3 4.0 4.8 3.2 3.9 1.9 4.9 3.8 5.3 2.6 5.3 5.5 5.8 2.7 6.8 7.4 5.6 3.3 根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。 请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法。 对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么? 二、一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题。 如对这些员工进行随即电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么? 抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的? 这些员工的加班时间是否独立?如果不是,原因可能是什么? 三、某城市的交通管理部门的一项调查表明,该城市中自驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的看法,该研究机构准备抽取一个简单随机样本进行检验。 请写出检验的原假设和备择假设。 请对小样本情况写出计算p值的公式,并论述你所依赖的分布,对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要假定的条件. 对于一般检验来说,如果结果表明“统计上显著”不是实际上也显著? 四、在对某项产品认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%,那么该报告是否负责?一个负责任的调查报告,应该给出什么相关信息? 五、对于主成份析,有人在进行了主成份分析之后,对得到的主成份又进行了第二次主成份分析,以得到更加精确的结果,请问这样做是否有道理?请加以说明。什么样的数据不适宜主成份分析?选择那些主成份累积方差贡献率为70-80%之类的准则是不是总是适用?为什么? 六、回归模型y=β0 +β1X1 +β2X2+…+βpXp+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项做出假定?如果不是,那么在什么情况下需要对误差项做出假定?做什么假定? 七、对于聚类分析,请回答以下问题。 (1)分层聚类前,需要对什么进行选择。 (2)描述分层聚类分析的详细步骤 (3)描述K均值(快速)聚类分析的详细步骤。 八、应用多元线性回归模型y=β0 +β1X1 +β2X2+…+βpXp+ε,如果一个SPSS回归分析的结果如下表所示: ANOVA Model Sum of Squares Df Mean Square F Sig 1 Regression Residual Total 106831048750.124 31085446686.216 137916495436.340 1 472 473 106831048750.124217 1622.118 .000(a) 2 Regression Residual Total 111136313278.118 26780182158.221 137916495436.340 2 471 473 55568156639.059217 977.312 .000(b) a Predictors: (Constant),Beginning Salary b Predictors: (Constant),Beginning Salary,Employment Category 则: 表中所用选择自变量的方法可能是什么? 表中的最后一个sig如何求得?意义是什么? 请给出该表最后一个F所表示的统计量服从F分布所需要假定的条件,并对该统计量服从F分布予以证明 2006年统计学真题 一、某银行为缩短顾客到银行办理业务的等待时间,准备采用两种排队方式进行实验:一种是所有顾客进入一个等待列队;另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,两

文档评论(0)

aicencen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档