- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商务管理学习课件 第二章 数据整理和描述
第二章 数据的处理和描述 主讲 石立 第一节 数据的处理 预处理 整理与展示 合理使用图表 第二节 数据的描述 集中趋势的度量 离散趋势的度量 分布形态的描述 一、数据的预处理 二、数据的整理与展示 三、合理使用图表 数据的预处理包括三个方面: 1.数据审核 2.数据筛选 3.数据排序 1.数据审核 (1)原始数据的审核 ①完整性审核——缺失值 ②准确性审核——异常值:逻辑检查 计算检查 (2)二手数据的审核 ①适用性审核 ②时效性审核 2.数据筛选 (1)将某些不符合要求的数据或有明显错误的数据予以剔除; (2)将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。 如:找出所有的一等品;找出成绩高于70分的同学等。 数据筛选中逻辑词的使用:“或”、“且”、“非” 3.数据排序 (1)按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 (2)排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 (3)在某些场合,排序本身就是分析的目的之一 如:《福布斯富豪排行榜》、《胡润富豪排行榜》、《中国大学排行榜》 二、数据的整理与展示 1.分类型数据的整理与展示 2.顺序型数据的整理与展示 3.数值型数据的整理与展示 1.分类型数据的整理与展示 (1)分类数据的整理 【例】性别 ①目标:制作频数分布表 A、在频数分布表的第一列列出各类别 B、整理指标(可计算的统计量): 频数(frequency):落在各类别中的数据个数 比例(proportion):某一类别数据占全部数据的比值 百分比(percentage):比例的百分数 比率(ratio):不同类别的频数之比 【练习】饮料类型 (2)分类数据的展示——图 ①条形图(Bar Chart):用宽度相同的条形的高度或长短来表示各类别数据的图形。 主要用于反映分类数据的频数分布。 ②饼图(Pie Chart):也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形。 主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用。 2.顺序数据的整理与展示 (1)顺序数据的整理 【例】P12,例2.1 目标:制作频数分布表 A、在频数分布表的第一列列出各类别 B、整理指标(可计算的统计量): 【一个重要规律】在分类数据、顺序数据和数值型数据中,我们常称分类数据相对另两种为低级数据,顺序数据级别稍高,数值型数据为最高级数据。 则有:低级数据的方法,高级的数据可以用;但高级数据的方法,低级的数据不可以用。 因此,顺序数据的整理可以使用分类数据的整理指标:频数、比例、百分比、比率 此外,顺序数据的整理有其特有指标:累积 A、从内容上看,有:累积频数、累积比例、累计百分比等 B、从方向上看,累积有两种:向上累积和向下累积 向上累积:顺序数据从顺序开始的一方向顺序的最后的一方累加; 向下累积:顺序数据从顺序最后的一方向顺序的开始的一方累加; 【练习】优良中差 (2)顺序数据的展示 根据【规律】,顺序数据可以使用分类数据的条 形图、饼图来展示。 顺序数据所特有的图为:累计频数分布图 向上累积频数分布图 向下累积频数分布图 3.数值型数据的整理与展示 (1)数值型数据的整理 目标:制作频数分布表-在频数分布表的第一列列出各类别。 【例】P13,例2.3 【问题】数值型数据并无类别 解决办法:需创造类别,即“分组”。 1)数据分组 ①单变量值分组:将数据按照总体(或样本)的某个特征变量或数据按个数直接进行分组,适合于少数的离散变量。 如:将某个班学生的年龄,按照学生的性别分组,分为男生的年龄和女生的年龄。 P13,例2.2,将每个数值型数据当做分类处理。 ②组距分组(距离分组):适合于连续变量,适合于变量值较多的情况,常用方法有: A、不等距分组:各组的组距不全相等。 如:国际上对人口年龄的分组,根据人口成长的生理特点分组为:0~6岁:婴幼儿组;7~17岁:少年儿童组;18~59岁:中青年组;60岁以上:老年组。 B、等距分组:每组的组距均相等 2)等距分组的步骤(P13,例2-3) ①找出数据中的最大值max、最小值min、数据个数n,并计算总距离d=max-min。 ②确定组数:组数的确定应以能够展示数据的分布特征和规律为目的。在实际分组时,可以按美国学者斯特杰斯Sturges提出的经验公式确定组数: 。 该公式求出的结果可以根据需要和方便的原则进行调整。 ③确定组距: 。 ④
文档评论(0)