- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CGSSSamplingDesing(Cycle2)_C.doc-中国综合社会调查
中国综合社会调查(CGSS)
第二期(2010-2019)目 录
一、调查背景 2
二、调查目标总体 2
三、抽样设计原则 2
四、抽样设计中的几个问题 3
(一)关于分层 3
(二)各阶段抽样单元 3
(三)样本量的界定及分配 3
五、具体设计 3
(一)必选层的样本抽取 3
(二)抽选层的样本抽取 3
六、最终样本的构成 3
七、样本权数的确定 3
(一)设计权数 3
(二)实际执行情况调整 3
(三)最终权数的确定 3
八、主要估计量 3
(一)各小层内部目标量的估计 3
(二)全国目标量的估计 3
九、估计量的方差估计 3
十、附录:抽选层100个样本初级单元 3
中国综合社会调查抽样设计方案
(2010)
一、调查背景
我国是世界上人口最多的国家,随着我国市场经济的发展,社会正在发生巨大的变革,经济发展使得对全国社会多方面信息的需求日益突出。及时、全面、客观地了解我国收入、医疗卫生、教育、失业保障等方面的信息,将为国家宏观调控政策的制定和企业的更好发展提供保障,对于促进城乡社会的协调发展、保持国民经济可持续发展都有着重大的现实意义。
中国综合社会调查是一项全国性的大型调查项目,调查总体是全国城镇居民和农村居民。本次调查的总体要求:(1)能够全面了解我国城乡社会发展情况;(2)能够对城市群体和农村群体进行对比分析;(3)能够在地理概念或者区域发展水平方面体现我国社会发展的地域差异性。
本方案着重介绍此次调查项目的抽样方案设计以及样本数据的权数调整方法。设计方案充分考虑了全国及不同地域估计的需要,对调查总体进行了科学、细致的分层,在一定程度上提高了估计精度;特别是在城乡样本配比、设立自我代表层、样本数据加权等问题的处理上体现了本方案的科学性、高效性、可操作性等特点。
二、调查目标总体
此次调查的目标总体为全国31个省、自治区、直辖市(不含港澳台)的所有城市、农村家庭户。
三、抽样设计原则
首先,作为全国性的抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区具有代表性。其次,抽样方案必须保证具有较高的效率,即在相同的样本量条件下,方案设计应使抽样误差尽可能小,调查精度尽可能高。最后,方案必须具有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。
四、抽样设计中的几个问题
(一)关于分层
根据本次调查的研究需要,将调查总体分为两大类:一是必选层,该层总体为入选大城市的市辖区家庭户;二是抽选层,该层总体为除去必选层市辖区以外全国所有家庭户。
1、必选层
根据调查需要及以往调查经验,本次调查对那些发展处于国内领先水平的大城市将特殊对待,将该类城市市辖区家庭户作为单独一层进行设计,作为必选层。
对于大城市的界定,着眼于直辖市、省会城市和副省级城市共36座城市,从经济水平、教育水平及城市开放性程度等角度出发,选取GDP、拥有教师总数、外国直接投资(FDI)实际使用外资金额这三个总量指标进行考察,采用因子分析方法确定排名前五的城市进入必选层。需要特别说明的是:该层的调查对象为这些城市的市辖区居民,该层最终调查单元均划为城市家庭户。
2、抽选层
抽选层的调查总体由必选层以外的城市、农村家庭户组成。为了便于在后期数据分析中采用平衡半样本进行方差估计,对初级抽样单元的分层划分打破省级地域限制增加分层的层数。排名 城市名称 1 上海 2 北京 3 广州 4 深圳 5 天津 个初级单元(街道),第个初级单元的人口规模为(),首先按地理区域将街道进行排序并产生累计人口数列,即排序第一位二级抽样单元为,对应的累积人口为;排序第二位的单元人口数为,对应的累积人口为,依次进行,则排序第的单元对应的人口数为,对应的累积人口为(),需要注意的是:这里的是指排序后单元对应序号。接下来,对第一个单元赋以共个代码;对第二个单元赋以共个代码,……,对第个单元赋以共个代码,人口总数为。
若已知初级单元样本量为,则首先可以确定抽样间隔,理论上,实际中一般取最接近于的整数。接下来从范围内随机地产生一个整数作为抽样起点,则代码为所对应的单元即为被抽中的初级单元,且第个抽样单元被抽中的概率为。
3、二级单元的抽取
在确定初级抽样单元(街道)后,二级单元抽样框为样本街道内所有居委会名单,同时收集各个居委会人口数。二级单元的抽取方法:在入选街道内,采用与各居委会人口规模成比例的系统PPS抽样抽取2个居委会。
具体抽取过程同初级单元部分。
4、最终单元的抽取
最终单元的抽取在每个入选的居委会中进行,在每个居委会内,按家庭户的门牌号进行排序,采取等概率系统抽样抽出50户家庭作为最终调查单元。这里,实际接触样本量在调查时视回答率状况分批投放,以达到既满足目标样本量,同时各二级样本单元(居委会)下最终样本(家庭户)数量差异不至于悬殊。必
文档评论(0)