网站大量收购闲置独家精品文档,联系QQ:2885784924

第11章调查中的非抽样误差.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
西蒙斯随机化回答模型 (无关问题的随机化回答模型) 西蒙斯(W.R.Simmons)在沃纳模型基础上进行改进,将第二个问题改为与所调查的敏感性问题完全无关的另外一个非敏感性问题.两个问题的一般陈述为: 问题1:你具有特征A吗?(特征A为敏感性) 问题2:你具有特征B吗?(特征B为非敏感性) 其中:具有特征的真实比例 为未知的,而特征B的比例 是设计时已知的,两个问题在随机化回答中出现的比例假设仍为p:(1-p),其中p已知。 例如:问题1:你在期末考试中曾作过弊,对吗? 问题2:你父亲的生肖属牛,对吗?( ) 在n个被调查者中,有m个人回答“是”,那么: 例题 [例]某社会学研究所欲调查已婚男子瞒着妻子存私房钱的情况,利用西蒙斯模型对随机抽出的800个已婚男子进行调查,设计的两个问题是: 问题Ⅰ:你是否存私房钱? 问题Ⅱ:你的阳历生日日期是奇数,对吗? 解:n=800,m=420,p=0.5, 采用随机化回答技术应注意的问题 1、要使被调查者充分理解调查方法,特别是让他们明白,他回答的是哪个问题别人并不知晓,事前可以让他抽取几次,以便确信盒子中有不同颜色的球。 2、所提的问题必须简单明了,防止不同的理解,在调查之前就应该明确问题的含义。 如:你的生日在五月,对吗?(阴历和阳历) 3、在应用西蒙斯模型时,无关问题的选择特别重要,一定要有隐蔽性,即:调查人员无从猜测被调查者的答案,否则就失去意义。 (如:你的身份证号码最后一位是奇数吗?这个问题就不好) 11.4 计量误差 一、概念: 计量误差是指由于种种原因导致的调查中的数据与其真值不一致。 二、原因 1、设计不周引起的误差 2、被调查者误差 3、调查者误差 4、其他误差(测量工具、编码、录入) 其中,被调查者误差分为两类: (1)无意识误差 主要表现为回忆误差,是对被调查的内容记忆不清而回答失真,无意识误差还包括“倾向性数字”。 (2)有意识误差 大多是由于问题的敏感或其他因素使回答具有某种倾向性。如:对收入、学历、职称等回答会偏高,对应纳税额会偏低。 无意识误差可以看成是随机的,不会带来估计偏倚,但有意识误差存在倾向性,会带来估计偏倚。 减少计量误差的措施 1、调查设计方面 方案的设计人员一定要经验丰富、素质高 2、现场准备方面 对调查人员的招聘、培训和管理都要规范 3、数据结果的审核方面 要细致的审核数据的完整性、一致性和有效性 11.5 离群值的检测和处理 一、概念 离群值是调查数据集中的极端值和其他数据明显不一致的观测值。 离群值可以分为单变量离群值和多变量离群值。 二、产生原因 1、被调查者回答数据有错误 2、调查人员记录数据有错误或数据录入有误。 3、可能数据本身具有差异性 三、离群值的确认 1、若m和s分别是测度数据集中趋势和离散趋势的指标,那么每个数据偏离中心的相对距离di为: 超过了预先确定的偏离值就为离群值。 或者利用置信区间确认 2、虽然样本均值和样本方差是常用的统计量,但是他们对离群值比较敏感,容易造成屏蔽效应因此不适合选择它们。 最流行的检测办法是利用四分位数法,利用中位数测度集中趋势、利用四分位域测度离散趋势,因为这两个测度值对离群值都不太敏感。 上、下四分位域: 第11章 调查中的非抽样误差 (non-sampling error) 抽样误差 非抽样误差 抽样框误差 无回答误差 计量误差 本章结构 11.1 引言 11.2 抽样框误差 11.3 无回答误差(补充敏感问题调查) 11.4 计量误差 11.5 离群值的检测和处理 学习目标 理解调查中的误差来源 掌握抽样框误差的类型及不完善抽样框的使用 掌握无回答误差的来源、影响及弥补措施 掌握敏感性问题调查模型 了解计量误差的来源 11.1 引言 一、概念 抽样误差(sampling error)是由于样本的随机性引起的样本统计量的数值与总体目标量真值之间的差异。它随着样本容量的增大而减小。 非抽样误差(non-sampling error)是指除了抽样误差之外,由于其他各种原因而引起的误差,是所有调查都可能存在的误差。 非抽样误差的特点 1、具有普遍性,由于它不是由于样本的随机性带来的,因而它不随样本容量的增大而减小; 2、非抽样误差的存在往往造成估计量的有偏(如:无回答); 3、具有隐蔽性,难以识别或测定; 4、产生原因复杂。 非抽样误差的产生 1、可能在调查及抽样设计阶段产生,如:问卷设计不合理造成词义含糊;抽样设计中抽样框不完善(这是一个重要原因);抽样设计中使用了不准确的辅助信息等等; 2、可能在数据采集阶段产生,如:无法找到被调查者或被调查者不在家或者不愿意接受调查(无回答是数据收集阶段产生非抽样误差的主要原因); 3

您可能关注的文档

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档