抽样框和样本抽取过程说明.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样框和样本抽取过程说明.doc

抽样框和样本抽取过程说明 一、抽样单位 本方案采用分层的四阶段不等概率抽样,各阶段的抽样单位为: 第一阶段:以区(地级市、省会城市和直辖市的各大城区和郊区)、县(包括县级市) 为初级抽样单位。 第二阶段:以街道、乡镇为二级抽样单位。 第三阶段:以居民委员会、村民委员会为三级抽样单位。 第四阶段:以家庭住户并在每户中确定1 人为最终单位。 二、构建抽样框 根据行政区划资料,全国(含22 个省、4 个自治区、4 个直辖市;不含西藏自治区、港 澳台)共有2801 个区县单位,这些区县单位作为PSU(初级抽样单元)构成调查总体,具 体划分为5 个抽样框。 抽样框1:三大直辖市市辖区 具体包括北京、天津、上海三个直辖市的共44 个市辖区,需要说明的是,这一部分未 包括直辖市重庆,原因如下: (1) 从设立直辖市的时间来看,1997 年全国行政区划正式设立重庆直辖市,而1949 年 建国之初即存在京津沪三大直辖市的行政区划。 (2) 从各省、直辖市人类发展指数(HDI)的排名来看,重庆与京津沪三大直辖市相比差距 较大(见表一); (3) 从所处经济地理区域上来看,重庆位于内陆地区,而京津沪三大直辖市均位于沿海 发达地区; (4) 从经济发展水平来看,重庆的人均GDP 与京津沪三大直辖市相比差距较大(见表 一); (5) 从城乡人口对比来看,重庆的农业人口与非农业人口的比例与京津沪三大直辖市相 比差距较大(见表一); 表一 重庆与京津沪三大直辖市部分指标对比 指标 北京 天津 上海 重庆 人类发展指数排名 2 3 1 22 人均GDP(万元) 2.26 1.79 3.48 0.52 非农业人口百分比 60% 56% 67% 23% 总之,从人文、经济、城乡人口对比、地理、历史等多方面相比较,重庆与京津沪三大直辖市的同质性并不明显;若简单地按行政区划的标准将重庆划分至直辖市这一抽样框,将对结果产生一定的影响。 抽样框2:省会城市市辖区 具体包括全国26 个省会城市和重庆市的共175 个市辖区。依照各城市的经济地理区域 分为三层。 东部:沈阳市、济南市、杭州市、南京市、福州市、广州市 中部:哈尔滨市、长春市、石家庄市、郑州市、太原市、合肥市、南昌市、武汉市、长 沙市、海口市、南宁市 西部:呼和浩特市、乌鲁木齐市、银川市、兰州市、西宁市、昆明市、贵阳市、西安市、 成都市、重庆市 抽样框3:东部地区区县 具体包括京津沪三大直辖市和东部6 省的所有区县,除去直辖市和6 个省会城市市辖区 部分;共611 个区县。即:北京(除市辖区)、天津(除市辖区)、上海(除市辖区)、辽宁省(除沈阳市市辖区)、山东省(除济南市市辖区)、浙江省(除杭州市市辖区)、江苏省(除南京市市辖区)、福建省(除福州市市辖区)、广东省(除广州市市辖区)。 抽样框4:中部地区区县 具体包括中部11 省和自治区的所有区县,除去11 个省会城市市辖区部分;共1136 个 区县。即:黑龙江(除哈尔滨市市辖区)、吉林省(除长春市市辖区)、河北省(除石家庄市市辖区)、河南省(除郑州市市辖区)、山西省(除太原市市辖区)、安徽省(除合肥市市辖区)、江西省(除南昌市市辖区)、湖北省(除武汉市市辖区)、湖南省(除长沙市市辖区)、海南省(除海口市市辖区)、广西壮族自治区(除南宁市市辖区) 抽样框5:西部地区区县 具体包括西部10 省和自治区的所有区县,除去10 个省会城市市辖区部分;共835 个区 县。即:内蒙古自治区(除呼和浩特市市辖区)、新疆维吾尔自治区(除乌鲁木齐市市辖区)、宁夏回族自治区(除银川市市辖区)、甘肃省(除兰州市市辖区)、青海省(除西宁市市辖区)、云南省(除昆明市市辖区)、贵州省(除贵阳市市辖区)、陕西省(除西安市市辖区)、四川省(除成都市市辖区)、重庆(除重庆市市辖区) 三、总样本量 由于调查的结果主要是估计各种比例数据以及比例数据之间的比较,所以在调查样本 量的确定上是以估计简单随机抽样的总体比例P 时的样本量为基础。在95%的置信度下按 抽样绝对误差不超过3%的要求进行计算,需要抽取样本量: 这里d 为抽样绝对误差取0.03,uα 在置信度为0.95 时为1.96, p(1? p) 最大取0.25。由于 采用多阶段的复杂抽样,设计效应deff 一般会在2 和2.5 之间,我们把deff 定为2,这样需 要的样本量就为2000 个。 综合考虑精确度、费用以及调查实施的可行性等因素,以及以往若干全国社会调查的 经验;再加上考虑到在调查实施中通常会存在一部分户内找不到、或没有合格调查对象、以 及各种原因造成的无回答等情况,根据对回答率的估计,以及总体划分为五个抽样框,我们 把样本量确定为10000 个。这10000 个样本不仅能满足对总体的估计,而且也能满足对抽样 框各自总体的估

您可能关注的文档

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档