- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总体和样本
* 第五章 总体和样本 * 第一节 基本概念 总体(population)是根据研究目的确定的具有相同性质的个体所构成的全体。 * 一、总体 一般我们把研究对象的全体称为总体(或母体),而把每一个研究对象称为个体. 例如,在研究某灯泡厂生产的灯泡质量时,该厂生产的灯泡全体构成的一个总体,其中每只灯泡都是个体;研究某班高等数学课程的成绩时,该班每个同学都是个体,全体同学构成一个总体. * 基本概念 样本(sample)是从总体中随机抽取的部分观察单位 抽样(sampling) 指从总体抽取部分个体的过程 样本含量(sample size): 样本所包含观察单位的数目 * 样本的选取应注意什么问题? 一是要留意样本在总体中是否具有代表性, 二是样本容量必须足够大, 三是注意样本避免遗漏某一群体 * 样本 我们知道,研究总体离不开研究它的体.但在许多实际问题中,不可能对所有个体逐一进行研究,而只能从总体中抽取一部分个体进行观察(或试验),根据对这部分个体的观察结果来推断总体的分布情况. 一般地,如果从总体中按一定规则抽取n个个体进行观察(或试验),则称这n个个体为总体的一个样本(Sample),样本中所含个体的数目n称为样本容量(Sample Size),抽取一个样本的过程称为抽样(Sampling). * 层(strata): 是指一个总体以某种特定的标准将其分为互相不包含的部分, 分层常在抽样过程中应用 随机化(randomization): 随机抽样: 总体中的每个研究个体有同等的被抽取的机会 随机分组: 研究对象有均等的机会被分配至各组 * 第二节 抽样的过程及方法 概率抽样法(probability sampling):调查者用客观、随机的方法抽取样本。 * 概率抽样 1、单纯随机:单纯随机抽样是指将所有的有限总体中的观察对象统一编号,再按照随机数字表或抽签等方法抽取一部分样本。 (抽签法) 抽签法 随机数字表法 * 概率抽样 2、系统随机(先确定间隔大小再抽签决定第一个调查对象) 系统抽样(systematic sampling):又称等距抽样或机械抽样,是指按照一定的顺序,机械地每隔若干个单位抽取一个单位的方法称为系统抽样 确定抽样间隔(H)=N/n 随机确定K * 概率抽样 3、分层抽样(stratified sampling)又称分类抽样:当研究的变量在总体中的不同层次有不同的分布时,需要采用分层抽样。(先分层再抽签) 指先按照与研究目的明显有关的某种特征将总体分为若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。 * 概率抽样 4、整群抽样(cluster sampling)是指将总体中所有的个体按某种属性分成若干个群体,再从所有的群体中随机抽取部分群体构成样本(以群为单位抽签) 适用范围:无法进行其他方法的概率抽样;总体中的个体不明确 优点: 易于实施,节省人力、物力 缺点:群间差异大时,可加大抽样误差 * 非概率抽样 1. 方便抽样(accidental sampling):指用最容易找到的人或物作为研究对象;优点是简便易行,缺点是样本的代表性差 2. 配额抽样(quota sampling):是根据总体内有层次性的特点,利用总体内各层的构成比抽取与总体相似的样本 * 非概率抽样 3. 主观抽样(purposive sampling):指研究者依据自己的专业知识和经验以及对调查总体的了解,有意识选取研究对象 4. 网络抽样(network sampling):利用社会网络的优势和朋友间具有共性的特点来进行抽样 * 第三节 样本量估计 检验水准,α( 犯假阳性错误的概率),如错误地把无效的治疗方案判为有效的危险性,一般错误定为0.05,也可定为0.01。 α越小,所需样本含量越大 检验效能( 1-β ) , (β)二类错误出现概率 , 犯假阴性错误的概率,如错误地把有效的治疗方案判为无效的危险性一般情况β=0.2或0.1或0.05,即80%、90%或95%把握度,把握度高,样本数就大。 * 总体标准差(σ): σ越大,观察值的变异程度大,所需的样本越大 容许误差的δ:既预计样本统计量和相应总体参数的最大相应误差控制在什么范围,常取可信区间长度之半。在其他条件确定的情况下,容许的误差越小,样本含量大;容许的误差越大,样本含量越小。 * 样本含量估计 计量资料,设计严谨,误差小,样本含量可小于30 计数资料:样本要大,严格控制误差,也需30~100例 可查表或用公式计算
文档评论(0)