网站大量收购闲置独家精品文档,联系QQ:2885784924

社会调查研究方法(第五版)课件 第八章 数据处理.pptx

社会调查研究方法(第五版)课件 第八章 数据处理.pptx

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第八章

数据处理;1.调查数据的处理过程包括资料检查与校订、资料编码、数据录入与整理等几个步骤。

2.资料的检查主要由问卷检查和调查回访两项工作构成。

3.资料编码需要注意以下几个要点:(1)编码的一般原则;(2)开放题的事后编码技术;(3)编码手册的编制;(4)封闭题的编码技术。

4.资料编码包括事前编码、边缘编码和事后编码等几种形式。;5.特殊题型的编码包括复选题和排序题的编码。

6.数据录入的方式主要包括人工输入、计算机辅助系统转换和光电输入这三种形式。

7.数据清理主要包括可能数值清理和一致性清理两种形式。

8.常用的缺失数据估计方法包括平均值估计法、回归估计法、删除缺失值和排除缺失值等几种。;数据处理

资料检查

资料校订

数据文件

编码

事前编码

边缘编码

事后编码

编码手册

栏位;目录;资料检查与校订;资料检查是指对调查得到的原始资料质量的审查与核实,目的是确定哪些资料可以接受,哪些资料要剔除掉。

它主要通过对回收问卷的完整性、准确性和真实性的检查来实现。;(一)检查问卷;(二)回访;复查问卷应包括以下一些内容:

(1)复查对象的原问卷编号;

(2)复查的次数及时间记录;

(3)确认访问员是否来访过;

(4)确认访问员是否访问了指定的被访者;

(5)(如果赠送礼品)确认访问员是否已送出礼品;

(6)复查对象对访问员访问态度的评价;

(7)从原问卷中挑选一些较敏感、较难回答或事实性的题目,回访复查对象,以此检验访问员是否有违规操作行为。

根据复查结果,研究者就能通过访问员的行为对问卷的真实性做出判断。;二、资料校订;校订人员遇到以上情况,除了要对其进行必要的标记,使之区别于问卷的正常记录方式外,还要对这些不合格问卷进行处理。

只要条件允许,首选的处理方案是将不合格问卷退回给调查执行人员(访问员或督导员),让访问员再次去回访被访者,对问卷进行修正,以获得较好的数据。

如果无法退回调查现场,可以将少量不符合要求的、不太关键的答案按缺失值来处理。

不过如果不符合要求的答案代表的是很关键的变量,或者不符合要求的答案在一份问卷中占的比例很大,就只能将这份问卷当作废卷处理了。;资料编码;一、编码的一般规则;研究者也可以在访问结束后,再逐一就被访者的回答进行编码的工作,这种编码方式被称为事后编码。开放式问题和封闭式问题中的“其他”选项,通常采取事后编码。

需要说明的是,采取事前编码或事后编码并没有固定的顺序与要求,研究者必须依照自身研究的时间与进度而定。;除了确定编码方式外,以下几项要点也是在编码时特别需要注意的。

首先,在编码的过程中,除了要对被访者每一个回答的选项进行编码外,还需对问卷编号、访问员编号等相关内容依统一标准进行编码

其次,如果被访者的回答内容本身就是一些数字资料,如被访者的年龄、收入等,在编码时应尽可能保留原来资料的面貌,以使资料的使用者有更大的空间可以自己把资料处理成所需要的变量类型。

最后,对于“不确定”“不知道”“其他”这样的特殊选项,在编码设计时要使用固定的代码,如“98”“998”等,并且最好在整份问卷中完全一致。;二、开放题的事后编码技术;第三,编码时,研究者在为编码员提供每一个编码项目的代码指南的同时,还应该附上几张单页编码纸,将需要编码的项目的名称和誊写答案的位置清楚地标在每页的顶端。

第四,对于某个分类含义不十分清晰的答案,最好还是设立一个新代码。

第五,对于事后编码来说,如果有两个或多个编码员参与编码工作,那么他们要么在不同的时间进行编码,要么同时在同一地点,依照同一编码手册进行编码。;三、编码手册的编制;;从内容看,上表大体可被划分为以下四个组成部分。

一是与编号有关的内容,包括栏位、问卷题号、变量编号。栏位表明的是某个变量在数据文件中列的位置。

二是与变量编码有关的内容,包括变量名称和变量标签。

三是与变量数值编码有关的内容,包括变量数值和变量数值标签。

四是与缺失值有关的编码内容。;单选题需要从所提供的多项答案中选择一项。因此,除去漏填的情况,每一个被测量的变量都会对应一个唯一的观测值。以“性别”为例:

例您的性别是:

(1)男(2)女;例8.2您一般通过下列哪些渠道搜集就业信息?(限选2项)

1.就业广告2.职业介绍所3.招工单位/公司/部门

4.政府劳动部门5.其他各类组织6.各类社会关系

7.其他(请说明)

这个问题在实际回答过程中被分解为两个子问题。

Q8.2a第一次选择的一项收集就业信息的渠道是?

Q8.2b第二次选择的一项收集就业信息的渠道是?;(三)复选题的编码;;(四)排序题的编码;;五、问卷编码中的其他问题;关于相依问题的编码处理方式类似于多选题的编码方式,对被访者来说,不适合回答的题目的处理同缺失值的处理。如:

例8.51.您的户口是否

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档