第3章数据的整理与展示分解.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 3 章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与展示 3.3 数值型数据的整理与展示 3.4 合理使用图表 3.1.2 数据排序 数据排序 (方法) 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n) 递减排序:可表示为:x(1)x(2)…x(n) 3.1.3 数据筛选 数据筛选 (data filter) 用Excel进行数据筛选 数据的整理与显示 (基本问题) 要弄清所面对的数据类型 不同类型的数据,采取不同的处理方式和方法 对分类数据和顺序数据主要是作分类整理 对数值型数据则主要是作分组整理 适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据 频数与频数分布 频数(frequency) :落在各类别中的数据个数 频数分布(frequency distributiong):把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来 比例(proportion) :某一类别数据个数占全部数据个数的比值 百分比(percentage) :将对比的基数作为100而计算的比值 比率(ratio) :不同类别数值个数的比值 生成频数分布表 (分类数据) 1. 列出各类别 生成频数分布表 (分类数据) 使用Excel数据透视表计数 (pivot table) 第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域(在操作前将光标放在任意数据单元格内,系统会自动选定数据源区域) 第3步:在【向导—3步骤之3】中选择数据透视表的输出位置,然后选择【布局】 第4步:在【向导—布局】对话框中,依次将“饮料类型”拖至左边的“行”(或列)区域,将“顾客性别”拖至 “列”(或行)区域,将“饮料类型”拖至“数据”区域。 第5步:单击【确定】,自动返回【向导—3步骤之3】对话框。单击【完成】 生成频数分布表 (列联表—Excel) 3.2.2 顺序数据的整理与图示 顺序数据的整理 (可计算的统计量) 1. 累积频数(cumulative frequencies):各类别频数的逐级累加 2. 累积频率(cumulative percentages):各类别频率(百分比)的逐级累加 顺序数据的频数分布表 (例题分析) 顺序数据的频数分布表 (例题分析) 顺序数据的图示—累计频数分布图 (例题分析) 环形图 (例题分析) 3.3.1数据分组 分组方法 单变量值分组 (要点) 1. 将一个变量值作为一组 2. 适合于离散变量且变量 值较少的情况 组距分组 (要点) 将变量值的一个区间作为一组 适合于连续变量 也适合于离散型变量但变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 组距分组 (几个概念) 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 组距分组 (步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5?K ?15 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 统计出各组的频数并整理成频数分布表 注意事项 -组距最好为5或10的倍数。 -最小组的下限略低于最小变量值,最大组的上限略高于最大变量值。 -离散型变量分组,相邻组的组限可以间断,也可以重叠;连续型变量分组,相邻组的组限必须重叠。 -组限重叠时,按“上限不在内”的原则归组。 频数分布表的编制 (例题分析) 生成频数分布表 (例题分析) 确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5?K ?15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例如,本例最大值为237,最小值为141,组距=

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档