网站大量收购独家精品文档,联系QQ:2885784924

第八章 非抽样误差课件.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 非抽样误差课件

第八章 非抽样误差;第八章 非抽样误差;本章结构;§8.1 引言;二、非抽样误差的特点 非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不可能随着样本量的增大而变小; 在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏; 有些非抽样误差难以识别和测定; 由于产生非抽样误差的渠道众多,有些非抽样误差成因复杂,尤其调查对象是人的时候,社会因素、经济因素对非抽样误差的范围和程度都产生不可忽视的影响。;三、非抽样误差的类型 抽样框误差,即由不完善的抽样框引起的误差; 无回答误差,即由于种种原因没有从被调查单位获得调查结果,造成调查数据的缺失; 计量误差,即所获得的调查数据与其真值之间不一致造成的误差。;§8.2 抽样框误差; 美国《文学摘要》对于1936年美国总统选举进行了预测,当时大多数观察家认为罗斯福会轻易获胜,而《文学摘要》根据自己的抽样断定兰登与罗斯福的获胜比率将是57%和43%.然而却是罗斯福以62%比38%的绝对优势坐上了总统宝座。与事实完全相悖的预测断送了这家原本颇有名气的杂志的前程,不久它只得停刊就此“关门大吉”。; 美国《文学摘要》发出了1000万张调查表,收回了200万张,花费了那么大的精力,收集了那么多的数据 ,怎么会出那么大的错误呢?主要原因就是抽样框的选取。原来它是按照电话簿和俱乐部成员的名单发出调查表的,由此选取的样本明显地排斥穷人!因为当时一般穷人很少拥有私人电话或隶属于哪个俱乐部(1936年,美国大约有1100万部住宅电话)。众所周知,经济地位在很大程度上影响着政治态度:穷人压倒多数地倾向于罗斯福而有钱人则偏向于兰登。《文学摘要》的样本反映不出这个社会现实从而犯了致命的错误。; 设计带来非抽样误差有很多表现在抽样框出了问题,第一章中所述的《文学摘要》的抽样框明显地偏向于某一部分人而忽略了另一部分人,从中产生的非抽样误差使得抽样结果不能反映总体(全体选民)的意见。这种致命的错误来源于抽样框“丢失”了总体中占有一定比例的单元,如果这一部分被“丢失”的群体在调查关心的参数方面有其独特的一面,那么这种“丢失”引起的非抽样误差使推断或估计带有明显的偏性。; 如果我们的抽样方案是分层抽样,分层抽样不太可能按照关心的总体参数去实施,而常常根据若干辅助信息来进行,当然这些辅助信息与调查变量应当有较强的相关程度。倘若这些辅助变量资料不健全,不准确甚至借用这些辅助变量本身属于判断失误,由此引起的非抽样误差可能会严重威胁到估计的准确性。; 有时候陈旧的抽样框将带来我们所不希望看到的非抽样误差,因为陈旧的抽样框会造成总体单元的“丢失”现象,一般地它还难以反映近期有关变量的一些变化。;§8.3 无回答误差;二、无回答误差产生原因及影响;(3)不能回答。某些被访问者对于问卷中的若干问题缺乏有关资料或者出于各种各样的原因而不愿意回答。; 造成无回答现象的原因有许许多多,但一般地,由政府部门出面组织的抽样调查常常能得到被调查者的友好合作,这种情况下无回答现象的比例相对地较少,然而对于一般的市场信息调查等非政府组织的抽样调查无回答现象比例非常的高。随着我国社会主义市场经济的发展和完善,这种情况正在逐步得到改善。; 其实调查人员的素质,调查问题的拟定,被调查人员的文化素质等等都对无回答率有一定影响。每项抽样调查,我们需要力求低比率的无回答现象,从目前来看,完全避免无回答现象是不可能的。;三、如何解决无回答现象产生的非抽样误差;2、科学进行数据分析; 然而事情并非这样地如意,无回答者常常拥有某些特征以致对调查的问题持有特定的态度,因此依据 个回答数据所作出的推断往往带有偏性。以总体平均数的估计为例,我们面临的情况相当于总体中N 个单元划分为两部分: ——回答者, ——无回答者。倘若抽样方式是简单随机的,那么 与 的比例理应相当于 与  的比例。这两部分的平均数分别记为 和 ,于是总体平均数为:;根据“回答者”部分的平均数 是 的无偏估计,用 估计 显然会产生偏倚:; (1)对某些问题无回答的数据以该问题回答数据的平均数来代替;; 上述做法还是相当于从 个回答者的数据出发对总体作出推断,但是在计算机上整体考虑来说是作为 个样本来处理的,给整体全面的推断带来某种方便,且也具有一定合理性,因为我们的抽样调查本身是要求 个均有回答的。然而这样的处理在精度上如何计算,或者说新构成的估计量方差如何估计,国外的一些统计学家曾作过研究与进一步的探索。; 实际工作表明,多次访问的确能做到减少无回答率,随之而引出的问题是承担的费用问题。一般地,抽样方案设计中会留下一部分经费用于“再访问”以便提高回答率。所谓多次访问

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档