统计学题库.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学题库

第五、六、七章:抽样推断 1.总体分布、样本分布、抽样分布 总体分布:总体中各个数据的分布 样本分布:样本中各个数据的分布 抽样分布:样本统计量的概率分布 总体的分布通过直方图观察,但一般不可能得到所有的数据,也就不能直接观察到总体分布。只要知道总体的分布类型和反映总体分布特征的参数就能够满足需要。 样本分布也称为经验分布,样本来源于总体,会包含总体的信息和特征,特别当样本容量较大时,样本的分布会很接近总体分布,但样本是随机抽取的,一般与总体分布有一定差异。 抽样分布是说明样本分布特征的统计量的分布,对它的理解是建立在反复抽样的基础上,样本是随机抽取的,不同的样本会有不同的统计量值,一个总体可以有很多个不同的样本,这样一个统计量就会有很多不同的取值,这些不同值的分布就是抽样分布。由于在实践中对于同一总体我们不会反复抽取很多样本,因此,抽样分布一般不能直接观察到,仅是一种理论分布。 抽样分布揭示了样本统计量与总体参数的内在联系,为统计推断提供了理论基础。 2.总体单位与抽样单位、样本容量与样本可能数目 3.统计量、总体参数及统计量的标准化 统计量是样本数据的函数,在实际抽样之前,由于是样本随机的,统计量也是随机的,但在抽取样本之后,样本已经确定,统计量也就是确定的,不包含任何未知变量。 总体参数是说明统计总体的数据特征值,一般是确定但未知的,是待估计的。 统计量的标准化是统计推断的必要过程,是将具体的统计量转化为已知分布的统计量,转化以后就可以确定一定区间的概率。 4.统计误差、抽样误差、抽样标准误差与抽样边际误差 统计误差是统计调查得到的值与客观实际值之间的差异。包括抽样误差和非抽样误差。 非抽样误差又称工作误差或调查误差,是指调查登记过程中由于登记、过录、计算等原因引起的误差。在全面调查和非全面调查中都有可能存在。 抽样误差也称为随机误差,是指在坚持了随机抽样的情况下,由于样本的随机性造成样本统计量与总体参数的差异。 样本是随机的,样本的统计量也是随机的,而总体参数是唯一的,因而抽样误差也是随机的。 在总体参数未知的情况下,一个具体样本的统计量与总体参数的实际抽样误差是不能直接观察到的,但在平均意义上,抽样误差是能够计算求得并可以控制的。 抽样误差一般用抽样标准误差来表示。抽样标准误差是样本统计量的标准差,在抽样方法(重复或不重复)、抽样方式(抽样组织形式)和样本容量一定的条件下,对一个总体来讲,抽样标准误差是一定的,不是随机变量。在现实生活中,一般仅取一个样本,不可能将所有可能样本都抽到,因此抽样标准误差仅是一种理论上的误差,不可能直接观察到。影响因素有总体数据离散程度、样本容量大小、抽样组织形式、抽样方法。 抽样边际误差是抽样推断中所允许的误差,又称抽样极限误差,是指在一次抽样估计中,配合一定置信水平所确定的误差范围,一般由调查需求者——客户提出,即是人为规定的。最初规定时表现为有量纲的绝对数,在统计推断中一般将其标准化,以抽样标准误差作为其计量单位,即以抽样极限误差对抽样平均误差的倍数来表示。 抽样边际误差与抽样标准误差不存在确定的大小关系。抽样标准误差是客观的,抽样边际误差是人为规定的,可以比抽样标准误差大,也可以比抽样标准误差小。 抽样极限误差不是最大可能误差,最大可能误差是指所有可能样本的统计量与总体参数的离差中的最大值。 5.正态分布、标准正态分布、t分布 6.无偏性、有效性与一致性 7.点估计:直接以样本统计量的值作为参数的估计值,不能说明估计的误差和可靠概率。 8. 区间估计:以一个区间的形式说明总体参数可能的范围。可以给出估计结果的误差大小和可靠概率。 9. 置信区间与置信水平、估计精确性与可靠性 置信区间是由样本统计量与抽样边际误差确定的一个随机区间,它的区间宽度是由抽样边际误差确定的,具体位置是由样本统计量决定。区间的宽度表明估计误差的大小,说明估计的精确性。 置信水平是一个概率值,是所有可能的随机置信区间中覆盖总体参数真值的比例。说明估计结果的可靠性。一般来讲置信水平是由统计需求者对统计工作提出的要求。 在其他条件如抽样方法、方式、样本容量等不变时,置信区间与置信水平是一对矛盾,即要提高精确性(缩小置信区间),就得降低可靠性(置信水平降低),若要提高可靠性(加大置信水平),就得容忍较大的误差。 要想同时提高精确性和可靠性,就得增加样本容量,或改进抽样方式、方法。 10.最小样本容量的确定 影响最小样本容量的因素有总体数据的差异程度(总体方差)、置信水平、边际误差以及抽样方式和方法。 总体差异程度越大、所要求的置信水平越高、边际误差越小,所需的样本容量就越多。 11.假设检验的基本思想 通过样本统计量与假设的总体参数比较来判断假设是否正确。两者一般不一致,产生差异的原因有:1.条件差异;2.随机差异。

文档评论(0)

allap + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档