- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数量方法-抽样方法与抽样分布
抽样方法与抽样分布 第一节 抽样的作用与抽样方法 一、抽样推断的含义 1.概念:它是按随机原则抽取样本数据,对总体的数量特征作出具有一定可靠程度估计和判断.以达到对总体的认识。 2.样本统计量和总体参数 1、总体:从统计调查的范围来看,全及总体即被研究现象或事物的总体,一般称总体。 总体可分为有限总体和无限总体 总体单位数习惯用“N”来表示。 2、样本:即从全及总体中随机抽取出来的那些单位所组成的整体。是总体的一个缩影,也叫子样。 样本单位数习惯用“n”来表示,也叫样本容量。 抽样作用 1、总体范围较广,不需要了解每一个别单位的情况。 2、对于具有破坏性的产品质量检测或进行抽样推断。 3、节约费用 4、时效性 5、提高调查质量,获得更准确的数据 抽样方法 1、简单随机抽样(重复抽样、不重复抽样) 1)重复抽样(回置抽样)——从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,把结果登记下来,又重新放回,参加下一次抽选。共可抽取Nn个样本。 样本由n次相互独立的抽选构成的,每次抽选是在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。 2)不重复抽样(不回置抽样)——从总体N个单位中抽取一个容量为n的样本,每次从总体中抽取一个单位,连续进行n次抽样构成一个样本, 但每次抽出一个单位就不再放回参加下一次抽选。共可抽取 个样本。每个单位中选的机会在各次是不相同的。 不重复抽样误差重复抽样误差 2、系统抽样(等距抽样、机械抽样) 抽样间隔:K=N/n 优点: 1、简便易行 2误差小于简单抽样 防止:周期性的波动 分层抽样 一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。 等比例-非等比例 优点: 1、不仅能对总体估计,而且能对层级子总体估计 2、组织实施方便 3、样本均匀 4、提高精度 整群抽样 整群抽样又称聚类抽样。(Cluster sampling)是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。 优点: 1、易获得,不需要对总体单元每个名单,只需要有群名即可 2、调查方便、集中、节约费用 应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。误差大 抽样中常遇问题 1、抽样框 指包含有全部总体单位及其主要标志特征的一个框架或列表。 抽样框是抽选样本的基本资料,故应把所研究总体的全部单位都包括在内而不发生重复和遗漏。 将要研究的总体是理论上的,现实中怎样操作,需要一个可行的抽样方案,其 必然涉及“到哪里去找样本单位”的问题。 无回答问题-需要人回答 1、无意的无回答 2、有意的不回答 影响:1样本量减少、误差增大、精度降低 2估计量的偏误,无法再样本量增大情况下减少 处理办法: 1、调查员培训 2、多次访问 3、替换无回答单元 4、对存在的无回答的结果进行调整 抽样误差 抽样分布与中心极限定理 1、总体分布 2、样本分布(估计总体) 3、抽样分布 不包含任何位置参数的样本的函数称作统计量 统计量的分布称作为抽样分布 中心极限定理 是指样本平均数分布的性质和总体分布的性质之间关系的系列定理。 它认证了: 第一、如果总体很大,而且服从正态分布,样本平均数(成数)的分布也同样服从正态分布。 第二、如果总体很大,但不服从正态分布,只要样本容量足够大,样本平均数(成数)的分布趋近于正态分布。 三、样本平均数(成数)的平均数,等于总体平均数(成数) 因此,在抽样推断中,不论总体服从什么分布,只要样本很大时,抽 样分布都服从正态分布,进而可以推算总体平均数或成数落在某一范围内的概率。 常用抽样分布 1、样本均值X的抽样分布 重复抽样:D(X)=?2/n 不重复抽样: 当N很大时, 样本比例的抽样分布 E(P)=p ,D(p)=pq/n, q=1-p P的抽样分布为P~N(p,pq/n(N-n/N-1)) 小样本抽样分布(自学) 卡方分布 t分布 F分布 Thank you! * 全及总体指标:参数(未知量) 样本总体指标:统计量(已知量) 统计推断 *
文档评论(0)