[理学]02基本概念.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]02基本概念

第二章 基本概念 个体(individual) 、观测单元(observation unit) ,承载数据信息的基本单位。 人口变动调查中,标准时点生存的每个人就是一个个体。 样本(Sample) 从总体中按一定程序抽得的那部分个体或抽样单元组成。 部分元素的集合。理想地,应是目标总体的一个子集。 基本概念 抽样单元(Sampling unit) 可根据实际条件,把若干个元素看作一个抽样单元,即将总体划分为若干抽样单元,按抽样单元实施抽样。 抽样单元可以就是元素。 抽样单元又有级别之分:初级单元、次级单元、三级单元等。 抽样框(Sampling frame) 所有抽样单元的清单。 一份完善的抽样框是取得理想样本的重要保证。 抽样框往往很难编制,可由普查、过去的调查、有关的登记资料获得。 几个概念之间关系的示意图 例 美国犯罪受害率的抽样调查 由美国人口普查局、公正统计局负责该调查,目的是估计去年全美犯罪受害的家庭数。 元素:单个美国家庭 目标总体:去年全部美国家庭 抽样框:由普查资料及建筑许可证资料获得的家庭资料 抽样总体:抽样框中包含的所有在家、且愿意接受调查的家庭 中国城镇居民收入及消费调查 目标总体:中国1996年12月31日的非农业城镇人口。 调查总体:1996年12月31日户籍在城市或者在县政府所在的城关镇家庭户中非农业常住人口,包括单身家庭,但是不包括登记在集体户的单身人员,也不包括流动人口以及在非县政府所在镇居住的个人或家庭。 一个名录框(目录框)定义为所有总体单元的实际的或者概念的名录清单。 概念名录框的一个例子是:某天早上9点至晚上8点之间进入某购物中心停车场的所有车辆的名录。一个概念名录框常常是基于一个调查正在进行中才存在的总体。 实际名录框可取自各种不同的来源。各级政府机构因各自的管理目的都保存一些名录,他们也是对抽样框进行维护的最有效的资料来源。这类名录框的例子如下: ?????? 生命统计登记:总体中所有关于出生和死亡的记录(由当地公安局收集); 商业注册:所有正在经营的公司及企业的名录(由工商行政管理部门收集); 地址和邮政编码册:所有城市地区的住址和邮政编码册(由当地公安局和邮政局收集); 电话号码簿:所有电话号码公开的家庭的电话号码簿。 区域框是其单元由地理区域构成的一种特殊的名录框,也称地域框。调查总体是由这些地理区域组成的。 区域框适用于以下所述的两种情况:当调查本质就是地理性质的(如通过每平方公里的野生动物数来估计野生动物的总数);或者统计调查机构不能获得一个适当的名录框。 简单随机抽样(SRS) (simple random sampling) 系统抽样(SYS) (systematic sampling) 分层抽样(STR) (stratified sampling) 整群抽样(cluster sampling) 多阶抽样(multi-stage sampling) 多重(相)抽样 (multi-phase sampling) PPS抽样 (sampling with probability proportional to size) 与大小(或规模)成比例的 不等概率抽样 适用于调查指标与单元大小直接相关的情况。例如:商业调查 三、总体指标 总体总量(population total) 总体均值(population mean) 总体具有某种特征的个体在全体中的比例(proportion) 总体中两个指标的总和或均值之比值(ratio) 四、总体模型 固定总体模型 超总体模型 五、误差与精度的表示方法 (一)抽样调查中的误差来源 1、非抽样误差 2、抽样误差:用样本估计总体而产生的误差。 估计量评价指标的选取:没有偏倚时,看方差的大小;有偏倚时,看均方误的大小; 偏倚与方差不同:方差是由抽样的随机性造成的一种随机性的误差,没有系统性,偏倚是偏于某个方向的系统性偏差;方差随着n的增大而减小,偏倚一般不会发生变化。 无偏估计量。 四、精度与费用 数据的种类: 调查数据和试验数据 调查数据:一般是指社会经济现象中不 断发生的客观事实,往往无法进行重复 试验,通常要通过调查或观察的方法来 收集或记录。这类数据随着时间的变化 而变化。 调查数据可分为:原始资料和次级资料。 试验数据:一般与自然科学的研究相联 系,其特点是在试验之前一般尚未发生, 因而需要通过事先的试验设计,在一定 的条件下进行试验,并将试验的过程及 结果加以记录和整理,而且可以进行重 复的试验。这类数据随条件的变化而变 化。 由于数据的性质不同和研究的目的不同, 因而就要用不同的调查和观察方法。如 经常性调查和一次性调查,全面调查和 非全

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档