- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样框和样本抽取过程说明.doc
抽样框和样本抽取过程说明
一、抽样单位
本方案采用分层的四阶段不等概率抽样,各阶段的抽样单位为:
第一阶段:以区(地级市、省会城市和直辖市的各大城区和郊区)、县(包括县级市)
为初级抽样单位。
第二阶段:以街道、乡镇为二级抽样单位。
第三阶段:以居民委员会、村民委员会为三级抽样单位。
第四阶段:以家庭住户并在每户中确定1 人为最终单位。
二、构建抽样框
根据行政区划资料,全国(含22 个省、4 个自治区、4 个直辖市;不含西藏自治区、港
澳台)共有2801 个区县单位,这些区县单位作为PSU(初级抽样单元)构成调查总体,具
体划分为5 个抽样框。
抽样框1:三大直辖市市辖区
具体包括北京、天津、上海三个直辖市的共44 个市辖区,需要说明的是,这一部分未
包括直辖市重庆,原因如下:
(1) 从设立直辖市的时间来看,1997 年全国行政区划正式设立重庆直辖市,而1949 年
建国之初即存在京津沪三大直辖市的行政区划。
(2) 从各省、直辖市人类发展指数(HDI)的排名来看,重庆与京津沪三大直辖市相比差距
较大(见表一);
(3) 从所处经济地理区域上来看,重庆位于内陆地区,而京津沪三大直辖市均位于沿海
发达地区;
(4) 从经济发展水平来看,重庆的人均GDP 与京津沪三大直辖市相比差距较大(见表
一);
(5) 从城乡人口对比来看,重庆的农业人口与非农业人口的比例与京津沪三大直辖市相
比差距较大(见表一);
表一 重庆与京津沪三大直辖市部分指标对比
指标 北京 天津 上海 重庆 人类发展指数排名 2 3 1 22 人均GDP(万元) 2.26 1.79 3.48 0.52 非农业人口百分比 60% 56% 67% 23% 总之,从人文、经济、城乡人口对比、地理、历史等多方面相比较,重庆与京津沪三大直辖市的同质性并不明显;若简单地按行政区划的标准将重庆划分至直辖市这一抽样框,将对结果产生一定的影响。
抽样框2:省会城市市辖区
具体包括全国26 个省会城市和重庆市的共175 个市辖区。依照各城市的经济地理区域
分为三层。
东部:沈阳市、济南市、杭州市、南京市、福州市、广州市
中部:哈尔滨市、长春市、石家庄市、郑州市、太原市、合肥市、南昌市、武汉市、长
沙市、海口市、南宁市
西部:呼和浩特市、乌鲁木齐市、银川市、兰州市、西宁市、昆明市、贵阳市、西安市、
成都市、重庆市
抽样框3:东部地区区县
具体包括京津沪三大直辖市和东部6 省的所有区县,除去直辖市和6 个省会城市市辖区
部分;共611 个区县。即:北京(除市辖区)、天津(除市辖区)、上海(除市辖区)、辽宁省(除沈阳市市辖区)、山东省(除济南市市辖区)、浙江省(除杭州市市辖区)、江苏省(除南京市市辖区)、福建省(除福州市市辖区)、广东省(除广州市市辖区)。
抽样框4:中部地区区县
具体包括中部11 省和自治区的所有区县,除去11 个省会城市市辖区部分;共1136 个
区县。即:黑龙江(除哈尔滨市市辖区)、吉林省(除长春市市辖区)、河北省(除石家庄市市辖区)、河南省(除郑州市市辖区)、山西省(除太原市市辖区)、安徽省(除合肥市市辖区)、江西省(除南昌市市辖区)、湖北省(除武汉市市辖区)、湖南省(除长沙市市辖区)、海南省(除海口市市辖区)、广西壮族自治区(除南宁市市辖区)
抽样框5:西部地区区县
具体包括西部10 省和自治区的所有区县,除去10 个省会城市市辖区部分;共835 个区
县。即:内蒙古自治区(除呼和浩特市市辖区)、新疆维吾尔自治区(除乌鲁木齐市市辖区)、宁夏回族自治区(除银川市市辖区)、甘肃省(除兰州市市辖区)、青海省(除西宁市市辖区)、云南省(除昆明市市辖区)、贵州省(除贵阳市市辖区)、陕西省(除西安市市辖区)、四川省(除成都市市辖区)、重庆(除重庆市市辖区)
三、总样本量
由于调查的结果主要是估计各种比例数据以及比例数据之间的比较,所以在调查样本
量的确定上是以估计简单随机抽样的总体比例P 时的样本量为基础。在95%的置信度下按
抽样绝对误差不超过3%的要求进行计算,需要抽取样本量:
这里d 为抽样绝对误差取0.03,uα 在置信度为0.95 时为1.96, p(1? p) 最大取0.25。由于
采用多阶段的复杂抽样,设计效应deff 一般会在2 和2.5 之间,我们把deff 定为2,这样需
要的样本量就为2000 个。
综合考虑精确度、费用以及调查实施的可行性等因素,以及以往若干全国社会调查的
经验;再加上考虑到在调查实施中通常会存在一部分户内找不到、或没有合格调查对象、以
及各种原因造成的无回答等情况,根据对回答率的估计,以及总体划分为五个抽样框,我们
把样本量确定为10000 个。这10000 个样本不仅能满足对总体的估计,而且也能满足对抽样
框各自总体的估
您可能关注的文档
- 必修一unit 3 travel journal课件.ppt
- 必修二化学第四章教案.docx
- 快乐复习 轻松迎考 402主题队会.doc
- 怀化职业技术学院毕业设计成果报告书.doc
- 怀化职业技术学院毕业设计方案.doc
- 怎样撰写教育科研课题研究报告.ppt
- 怎样确定统计量的样本容量.doc
- 思修关于法律意识的调查报告.doc
- 思想政治教育心理学研究_现状_问题与发展.pdf
- 总经理职位要求.doc
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)