- 1、本文档共77页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 3 章 数据的图表展示 1. 列出各类别 数值型数据的图示 ?多变量数据的图示 两个变量间的关系—二维散点图(2D Scatterplots) 展示两个变量之间的关系 用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图 120 98 110 68 58 40 25 降雨量/mm 8250 21 7500 16 5800 14 5750 13 4500 10 3450 8 2250 6 产量/kg/hm2 温度 / 0C 两个变量间的关系—二维散点图(2D Scatterplots) 三个变量间的关系—气泡图(bubble chart) 显示三个变量之间的关系 图中数据点的大小依赖于第三个变量 也称为蜘蛛图(spider chart) 显示多个变量的图示方法 在显示或对比各变量的数值总和时十分有用 假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比 可用于研究多个样本之间的相似程度 多变量数据—雷达图(radar chart) 顺序数据的频数分布表(例题分析) 【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?” 1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。 甲城市 回答类别 — — — — 100.0 300 合计 100.0 92 56 25 10 300 276 168 75 30 8.0 44.0 75.0 90.0 100.0 24 132 225 270 300 8 36 31 15 10 24 108 93 45 30 非常不满意 不满意 一般 满意 非常满意 百分比 (%) 户数 (户) 百分比 (%) 户数 (户) 向下累积 向上累积 百分比 (%) 户数 (户) 甲城市家庭对住房状况评价的频数分布 顺序数据的频数分布表 (例题分析) 乙城市 回答类别 — — — — 100.0 300 合计 100.0 93.0 60.0 34.0 12.7 300 279 180 102 38 7.0 40.0 66.0 87.3 100.0 21 120 198 262 300 7.0 33.0 26.0 21.3 12.7 21 99 78 64 38 非常不满意 不满意 一般 满意 非常满意 百分比 (%) 户数 (户) 百分比 (%) 户数 (户) 向下累积 向上累积 百分比 (%) 户数 (户) 乙城市家庭对住房状况评价的频数分布 顺序数据的图示—累计频数分布图 (例题分析) 24 300 132 225 270 0 100 200 300 400 非常 不满意 不满意 一般 满意 非常 满意 累 积 户 数 (户) (a)向上累积 276 168 30 300 75 0 100 200 300 400 非常 不满意 不满意 一般 满意 非常 满意 累 积 户 数 (户) (b)向下累积 甲城市家庭对住房状况评价的累积频数分布 环形图(doughnut chart) 环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示 与饼图类似,但又有区别 饼图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究 用于展示分类和顺序数据 环形图 (例题分析) 8% 36% 31% 15% 7% 33% 26% 21% 13% 10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价 3.3 数值型数据的整理与展示 3.3.1 数据分组 3.3.2 数值型数据的图示 数据分组 组距分组 (要点) 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 组距分组(步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5?K ?15 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 统计出各组的频数并整理成频数分布表 组距分组(几个概念) 1. 下限(lower limit) :一个组
文档评论(0)