- 1、本文档共44页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 资料的基础分析: ——描述统计 学习目标 了解资料输入计算机之前的处理工作 掌握如何列表(双向交叉列表) 了解如何对资料进行统计分析 8.1 数据的确认、编辑和编码 确认 访谈是否以适当的方式 进行,访问员是否造假(回访10%~20%) 电话确认 确认此人是否真正接受了调查? 被调查者是否符合条件? 是否按要求的方式调查? 确认调查是否完整? 检查其他问题 确认的目的 编辑 对访问员和应答者的错误进行检查 确定访问员是否没有问某些问题或者没有记录某些问题的答案 核实问卷,以保证遵循了规定的跳跃模式 检查开放式问题的答案 要求访问员逐字记录答案,不以任何方式重新释义、表达或插入自己的语言。同时对问题的答案进行“追问” 编辑 实地编辑 完整性 清楚性 内容的一致性 明确性 单位的统一性 编辑 办公室编辑 更完整、确切地审查和校正回收的资料 重点在于所查出问题的如何处理方面 不完整答卷的对策 大面积不回答,废卷; 个别问题无回答,有效问卷并补救; 相当多问卷对同一问题无回答,有效。 明显回答错误对策 无兴趣答卷的对策 纠正对开放性问题的打乱顺序的回答。 编辑 开放式问题的记录 对于开放式问题的回答,访问员记录不当的例子 问题:你为什么在众多的快捷/方便的餐馆中选择经常去肯德基? 回答记录:顾客似乎觉的肯德基有更加美味的食物和一流的服务环境 服务员没有进一步追问的例子 问题:同上 回答记录:因为感觉比较好。 编辑 适当的记录和追问的例子 问题:同上 回答记录:因为感觉比较好。那里的服务员态度好,而且环境比较好。 编码 编码定义 对一个问题的不同回答进行分组和确定数字代码的过程。大多数问卷中的大多数问题是封闭式的,并且已预先编码。 编码主要是针对开放式问题进行。 编码的原因 文字记录对于定量分析不合适:1)对于用计算机分析,文字不太有效;2)调查分析记录不便于计量,100人有100种回答。编码就是把相似的进行归类。 编码 编码过程 列出答案 合并答案:一些形式上不同的答案,在本质上是一致的,可以被合并为一类。 设置编码 4、输入编码 读取每组问题中每个开放式问题的回答。 找出与按步骤2得到的合并类别相符的回答 把每个具体的回答得数字编码填入相应的类别中 在调查表的适当地方,注明每个问题回答的数字编码 编码 例:对于您最近一次购买体育用品、运动鞋或 运动服装,您买的是什么? 假设有6位被访者分别购买了一个篮球、一双跑鞋、一副网球拍、一双网球鞋,羽毛球,运动服。 “1”代表运动器材;“2”代表运动服装 “3”代表运动鞋 编码明细单 为把资料准确地输入计算机,需要制定一套规则,即编码明细单。 一份说明文件中各个问题(变量)及其答案,与计算机数据文件中的字段、数码位置及数码之间一一对应关系的文件。 编码明细单 需要注意的问题: 所有资料转化为数值,不允许有字母或其他字符 每一个数值码占据一列,(单选题和多选题) 无信息的答案赋予标准代码 每条记录的第一个字段都为问卷的编号。 例:P147 8.2 资料的初步分析——列表 列表:把调查资料按照一定的目的、用表格的形式展现出来; 单项列表:仅计数一个变量不同数值的出现次数的列表; 交叉列表:同时计数两个或两个变量的不同数值联合出现的次数的列表。 8.2.1 单因素表格化分析 目的: 1、弄清无回答现象的程度; 2、弄清编误和飞点发生在何处; 3、弄清变量的经验分布; 4、计算主要的描述指标。 8.2.1 单因素表格化分析 无回答 无回答数目过多会影响调研的数据分析和最终质量 指定一些特别的数字表示无回答(缺省值) 对于缺省值可用的方法:1.保留下来作为单独的一组;2 .临时排除含有缺省值的记录;3.以其它数值替补缺省值(其中趋势量最常用) 8.2.1 单因素表格化分析 编误与飞点 作单项列表时,可能发现一些不正常的数值,经查对原值并非如此,这种误差称之为“编误”,可被纠正。 飞点——经查对与原值相符,但是与其他的观察值相比,特别大或者特别小,无法纠正。 箱线图有助于发现飞点。(由上四分位数、下四分位数、最大值和最小值决定的) 8.2.1 单因素表格化分析 频数分布表 对于有飞点的数据宜采用不等组距,并设立开口 单项列表的主要描述量 众数、中位数、平均值和标准差等。(可用相关软件直接进行计算) 描述性统计 集中趋势测量 类别和顺序量表 等距和等比量表 均值 中位数 众数 描述性统计 众数 一串数字中出现次数最多的值。 通过制作频数分布表,可以较容易的找出。 分类变量宜采用众数。 中位数 一组有序值得列里居中的那个值。 其余值中一半要大于这个值,而剩余的一般要小于这个值。n是奇数或偶数。 通过计算累计百分数 描述性统计 离散程度的计量 方差 标准差的平方
您可能关注的文档
最近下载
- 2025年新苏教版数学一年级下册整册课件.pptx
- 2025年春季教导处工作计划.doc VIP
- 安全生产风险分级管控与隐患排查治理的成功案例分析.pptx
- 2024年辽宁省大连市中考数学试卷(含答案及解析).docx
- 中华护理学会团体标准TCNAS21─2024解读:胰岛素皮下注射.pptx VIP
- 必威体育精装版全国各地中考语文满分作文.doc
- 【2025春】冀教版四年级数学下册教学计划(含进度表).docx
- 2025年中考语文总复习:《整本书阅读(名著阅读12部)》教材知识梳理.docx VIP
- 最终印刷版:全国杜仲产业发展规划(2016年-2030年).pdf VIP
- 卫生事业管理学讲义.ppt
文档评论(0)