第2章 用图表展示数据.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * 两个变量间的关系—矩阵散点图 (Matrix Scatter) * 比较多个样本的相似性 —雷达图 (radar chart) 也称为蜘蛛图(spider chart) 从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图 可用于研究多个样本在多个变量上的相似程度 当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。 线性变换: 对数变换: * 多变量数据—雷达图 (例题分析) 【例2-6】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表2—8所示。绘制雷达图,比较不同地区的消费支出构成 * 多变量数据—雷达图 (例题分析—原始数据) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 多变量数据—雷达图 (例题分析—标准化变换) 更适宜分析多个样本在多个变量上的差异 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法 将各变量用一系列平行的横坐标轴表示,变量值对应纵轴上的位置 可用于研究多个样本在多个变量上的相似程度或变量间的相互关系 比较多个样本的相似性 —平行坐标图 (轮廓图) * 多变量数据—轮廓线图 (例题分析—比较样本:地区) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 * 多变量数据—轮廓线图 (例题分析—比较变量:各项支出) 四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的 东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大 四个地区各项支出额的结构具有很大的相似性 2.3 合理使用图表 第 2 章 用图表展示数据 * 一张好的图表应包括以下基本特征 显示数据 让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 鉴别图表优劣的准则 * 本章小结 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表 结 束 * * * * * * * * * * * * * * * * * * * * * 生成频数分布表 (例题分析) 【例2-3】某电脑公司120天的销售额数据(单位:万元) 。生成一张频数分布表观察销售额分布的特征 * 生成频数分布表 (例题分析) 确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5?K ?15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例如,本例最大值为237,最小值为141,组距=(237-141)÷10=9.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足a?xb(上限值不在内(Excel的计数规则是ax?b) * 分组中的几个概念 1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 下限值+上限值 2 组中值 = 制作频数分布 * 生成频数分布表 (例题分析) 某电脑公司销售额的频数分布 * 使用Excel频数函数 (FREQUENCY) Excel的【直方

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档