- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断的过程 第三章 概率、概率分布与抽样分布 第一节 常用的抽样方法 第二节 抽样分布 1、理解常用的概率抽样方法概念 2、掌握抽样分布的概念 3、掌握单一总体的样本统计量的分布及特征 4、理解中心极限定理的内涵 第一节 常用的抽样方法 一、概率抽样(probability sampling) 1、含义:根据一个已知的概率来抽取样本单位,也称随机抽样。 2、特点: 按随机原则抽取样本:每个单位都有机会 每个单位被抽取的概率是已知或可计算的 当用样本对总体估计时,要考虑每个样本单位被抽中的概率 3、常用的概率抽样方法 (1)简单随机抽样( simple random sampling) 从总体N个单位中随机抽取n个单位作为样本,使得每一个单位都有相同的概率被抽中的抽样方式。 两种抽取方法: 重复抽样(sampling with replacement) 不重复抽样(sampling without replacement 优点:简单、直观 用样本统计量对总体参数进行估计比较方便 局限性:当N和n很大时,工作量太大 抽出的单位分散,给实施调查增加了困难 (2)分层抽样(stratified sampling) 将总体单位按某种特征划分为若干不同的层,然后从各个层中抽取一定数量的单位共同构成样本的抽样方式。 优点: 保证样本与总体结构相近,可提高估计精度 组织实施调查方便 既可估计总体,也可估计各层子总体 分层注意事项: 层的划分应尽可能符合数据规律,使样本很好代表总体,应遵循“层间差异大,层内差异小”。 (3)系统抽样(systematic sampling) 将总体所有单位按一定顺序排列后,按某种规则随机地确定一个单位为抽样起点,每间隔一定距离抽取一个单位组成样本的抽样方式。 也称等距抽样或机械抽样 实施方法: 排序后,将单位编号1,2,…,N; 确定距离k=N/n,随机取r∈[1,k]作为初始位置; 依次取r+k,r+2k,…,r+(n-1)k等位置单位,组成样本。 优点:操作简便; 总体数量均匀分布时可提高估计精度 缺点:对估计量方差的估计比较困难 (4)整群抽样(cluster sampling) 将总体划分为若干个组(群),随机抽取部分群,然后对中选群中的所有单位进行调查的抽样方式。 优点: 抽样时只需群的抽样框,简化工作量 调查相对集中,节省调查费用,方便调查实施 缺点:估计的精度较差 整群抽样注意事项: 组群的划分应尽可能符合数据规律,体现出“群内差异大,群间差异小”的原则。 二、非概率抽样(non-probability sampling) 1、含义:抽取样本时不是依据随机原则,而是根据研究目的的要求,采用从总体中人为的选取部分单位实施调查。 2、主要抽样方式: 方便抽样:确定样本单位时主要考虑到方便抽取的因素。 判断抽样:研究人员根据研究内容和以往的经验来确定所抽取的样本单位。 3、特点: 不能对总体进行推断 第二节 抽样分布 一、参数与统计量 二、抽样分布的概念 三、样本均值的抽样分布 四、样本比率的抽样分布 五、样本方差的抽样分布 一、参数与统计量 1、参数(Parameter) 用来描述总体特征的综合指标。 基于总体资料计算: 3、参数与统计量的关系 对于一个既定总体来说,参数是确定的、唯一的。 而从同一个总体由于抽取的样本组成单位不同,由此计算出的统计量则是随机变量。 实践工作中,总体特征往往未知,需要由样本资料进行估计,即由统计量来估计参数。 二、抽样分布 1、总体分布:总体各元素的观察值所形成的分布。 2、样本分布:一个样本容量为n的样本中n个观察值的分布。 3、抽样分布:统计量所有可能取值形成的概率分布。 1)是一种理论概率分布 2)样本统计量是随机变量 样本均值, 样本比例等 3)结果来自容量相同的所有可能样本 三、样本均值的抽样分布 1、概念要点 1)在重复选取容量为n的样本时,由样本均值的所有可能取值形成的概率分布。 2)一种理论概率分布 3)是推断总体均值?的理论基础 2、形成过程(一个例子) 3、抽样分布形式 中心极限定理 中心极限定理 ?x 的分布 趋于正态 分布的过 程 样本均值的抽样分布与总体分布的关系 4、样本均值抽样分布的特征 1.样本均值的数学期望 2.样本均值的方差 重复抽样 不重复抽样 式中:M为可能样本数目,是指从一个有N个单位的 总体中抽取容量为n的样本时,出现的所有 可能样本的个数。 结论: 1)样本均值的均值(数学期望)等于总体均值 2)样本均值的方差等于总体
文档评论(0)