徐静霞版统计学第3章数据的图表显示.课稿.ppt

徐静霞版统计学第3章数据的图表显示.课稿.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据检查的主要步骤 1、事先制定出检查的规则,明确规定出哪些问卷可以接受、哪些问卷必须拒绝等,并对每一份问卷进行检查。 2、根据检查规则,将所有的问卷分为三个部分:可以接受的、明显要作废的、对于是否可以接受有疑问的。 一般而言,下面情况的问卷是要作废的: 所回收的问卷是明显不完整的,如缺失了一页甚至更多内容; 问卷从整体上看是回答不完全的; 问卷的几个关键部分的内容回答不完全的; 问卷显示调查员或被调查者没有理解或遵循访问要求,如没有按要求跳答等; 问卷中的答案几乎没有什么变化的; 问卷是在事先规定的截止时期以后回收的; 问卷是由不符合要求的被访者回答的; …… 调查数据的插补 1、插补是解决在审核过程中辨别出来的数据缺失、无效或不一致等问题的过程。 2、插补方法分为两类:随机插补和确定性插补。 确定性插补的具体方法有:推理插补、均值插补、比率/回归插补、热平台插补、冷平台插补、最近邻值插补。 调查数据的插补 1、插补是解决在审核过程中辨别出来的数据缺失、无效或不一致等问题的过程。 2、插补方法分为两类:随机插补和确定性插补。 确定性插补的具体方法有:推理插补、均值插补、比率/回归插补、热平台插补、冷平台插补、最近邻值插补。 【例3.4】对某高校的教师进行一次学历调查,在被调查的2000名教师中,学历水平共分四种类别,学历水平从低到高依次是:1.大专;2.本科;3.硕士;4.博士。调查结果的频数分布表如下表所示。 学历水平 人数 (人) 百分比 (%) 向上累计 向下累计 频数(人) 频率(%) 频数(人) 频率(%) 大专及以下 160 8 160 8 2000 100 本科 240 12 400 20 1840 92 硕士 1220 61 1620 81 1600 80 博士 380 19 2000 100 380 19 合计 2000 100 累计频率(例题分析) (1)累积频数分布图 向上累积分布图 向下累积分布图 顺序数据的图示 (2)环形图(doughnut chart) 家庭收入 很幸福 比较幸福 一般 不太幸福 很不幸福 2万以下 2~5万 5~10万 10万以上 14.79 17.59 21.97 31.71 29.40 36.48 41.27 40.08 44.36 38.39 29.24 19.36 6.52 4.73 4.06 3.80 4.93 2.81 3.46 5.05 【例3.5】2010年1月,央视财经频道中国财经报道栏目主办了“CCTV2009经济生活大调查”,共收回近8万份有效问卷,下表是:“您对目前生活的感觉?A很幸福? ? B比较幸福? ? C一般? ? D不幸福? ? E很不幸福。”这一题目的统计结果。 环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示; 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环; 用于结构比较研究 ; 用于展示分类和顺序数据。 3.3 数值型数据的图表展示 3.3.1数据分组 3.3.2数值型数据的图示 数据分组 (1)单变量值分组: 把每一个变量的取值都作为分组标志形成一组; 单变量值分组方法适合于离散变量; 适用于变量值较少的情况。 (2)组距分组 将某一区间的变量值作为一组 适用于连续变量 适用于变量值较多的情况 分为等距分组和不等距分组 组距分组相关概念 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 下限值+上限值 2 组中值 = 上限值-下限值 组距 = 组距分组的步骤 第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序。 第2步:确定组数。一组数据所分的组数 K不应少于 5组且不多于 15组,即 5< K<15。在实际分组时,也可以借助经验公式来确定组数K, 第3步:确定各组的组距。 第4步:根据分组整理成频数分布表。 最大值-最小值 组数 组距 = 组距分组(例题分析) 【例3.6】某高校国际贸易学专业共有130名学生,学校对该专业的所有学生进行了一次专业外语口语测试,其成绩如表3—17所示,试对下列数据进行分组分析。 93 69 83 77 75 96 69 63 54 60 97 54 71 88 78 68 76 95 66 86 82 82 72 68 84 70 76 68 95 76 67 73 56 70 81 63 83 82 79 86 57 84 67 79 56 78 93 86 79 67 82 64 90 83 92 7

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档