- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从问卷调查数据中可以得到什么_
从问卷调查数据中可以得到什么 ?
吴喜之 骆 鹏 罗玉波
ABSTRACT
This study describes the existing problems and mistakes that may cause misunderstanding or even misleading in current analyses of questionnaire survey data and suggests methods to do exploratory data analyses and select related variables for further inference .
关键词 : 问卷调查 ; 数据 ; 抽样设计
在许多实际或研究领域中 , 进行问卷调查是收集信
息所不可缺少的重要手段 。然而 ,多数调查报告仅仅利 用了调查数据中的一小部分信息 , 而把大多数信息浪费 掉了 。调查者可能认为 ,他们获取的部分信息已经满足 了需要 ,达到预期的目的 。但是 , 在写调查报告时 , 人们 应该思考以下的问题 : 他们展示的各种比例是否合适 ? 为了得到结论所选择的变量是否妥当 ? 分析所基于的假 设是否满足 ? 是不是还有更好的分析工具来达到既定目 标 ? 除了既定目标之外 ,从该调查数据是否能够得到一 些其他意想不到的收获 ? 本文试图对这类问题进行讨 论 ,并通过一个实际调查数据加以说明 。
本文主要涉及问卷调查数据中的单选问题的数据分 析 。这里不讨论比较简单的只有一两个问题的诸如民意 测验那样的调查 , 也不讨论问卷中的自由回答问题和多 选问题 。当然 ,多选问题也可以转换成单选问题来提出 或者分析 。本文所引用的调查例子是在浙江进行的《金 融机构员工思想动态调查问卷》① 数据 ( 后面简称“金融 员工调查”数据) 。问卷及抽样方案的设计是抽样调查的 主要内容之一 ,但本文仅讨论调查数据的分析部分 。
一 、问题的提出
抽样调查在我国起步较晚 , 但发展迅速 。在我们周 围 ,进行着各种形式的调查 。但是许多兴师动众 、耗费巨 资的大型问卷调查的最后报告却主要由许多描述性的各 种比例所组成 ;这些比例用各种图表显示 ,给人以深刻印 象 。这些大量展示的比例实际上是更深入分析的素材或
得结论完全没有意义或代表性 。许多调查报告中的绝大
多数的比例都没有给出置信区间和置信度 , 因此也没有 任何说服力 。其实人们更想知道的是各个因素之间的关 系 ,并且试图找到它们如何相互影响 ,为今后决策找到令 人信服的根据 。有些调查报告利用了广义线性模型或多 元分析方法来分析变量之间的关系 , 这比仅仅展示描述 性的比例要进一步 。但如何选取模型中的变量 ,使得分 析结果有说服力 ,则是一个容易忽视但非常重要的课题 。
二 、问卷调查数据的结构和特点
一个问卷调查数据到底有什么性质 , 这是在对数据 利用现成软件分析模块进行分析之前必须了解的 。
11 比例中的垃圾 由于比例是通常调查报告中包含最多的内容 。我们
首先来看到底一个问卷调查数据可以产生多少比例 。一 个问卷中的问题 (变量) 越多 、问题的可选择回答越多 ,理 论上所能够产生的比例就越多 。当然 ,并不一定所有的 比例是我们所感兴趣的 。但是 ,在人们感兴趣的比例之 中 ,有许多可能是不显著的 、无法说明的或者没有意义 的 。而在我们事先没有想到的比例中 ,很可能会存在有 价值的信息 。
以“金融员工调查”数据为例 。从表面上看 , 该数据 理论上可以产生大量的比例 。先考虑以全部观测值数目 作为分母的比例 。如果允许每一个问题的每一个范畴 (回答) 的观测值数目作为分子 ,该数据理论上可产生 250 个比例 。一个这样的例子是“最关心的是个人收入的员
出发点 ,而不是结论或决策 。因为很难想象有多少决策
者有耐心从头到尾阅读这种报告的全文 。即使是这些在
报告中占大量篇幅的比例 ,也大多没有说明其可信程度 。
① 该问卷有 60 个选择题 ,其中有 6 个是多选题。此外该问
卷还有 6 个自由回答题。我们只选了 54 个单选题 ( 即每个问题
工占全体员工中的比例”。而如果以某一问题的某个范 畴 (回答) 的观测值数目作为分母 , 以分母和其他某范畴 的交 集 的 观 测 值 数 目 作 为 分 子 , 理 论 上 就 可 以 产 生
122468 个比例 ,比如“在高级职称员工中认为首要改革的 是经营制度的比例”等 。如果分母由两个范畴的交观测 值数目组成 ,分子为其他范畴和分母的交观测数 ,那么理 论上可能出现的比例将近 1500 万个 ,为个 。一 个这样的例子为“51 岁以上女性员工想跳槽的比例
文档评论(0)