数据分布特征描述.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分布特征描述.ppt

数据分布的特征: 一、集中趋势:反映数据向其中心靠拢或 聚集程度; 二、离中趋势;数据远离中心的趋势(又称离散程度); 三、偏态和峰态;偏态是对数据分布对称性的度量;峰度是指数据分布的平峰或尖峰程度(形状)。 3.1集中趋势的度量 分类数据----众数 顺序数据----中位数和分位数 数值型数据----均值 众数、中位数和均值的关系 3.1.1分类数据----众数 一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据(spss计算) 众数的计算方法总结: 1、观察法(①②例题分析) 2、插值法P76(③例题分析) 所谓插值法就是先找到众数所在的组,然后按该组次数与前后相邻两组分布次数之差所占的比重推算众数值。 例3.1 某车间实行计件工资,2005年10月120名工人的月工资资料如下表所示: 要求:试计算月工资的众数。 解:从上表中我们可以看出,月工资变量值中最大的字数为48人,即众数组为1000-1200这一组。根据公式,可得: 众数的特点 众数是以它在所有变量值中所处的位置确定的一个代表值,它不受分布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。 众数有可能不存在,也可能存在多个; 众数缺乏敏感性。 3.1.2 顺序数据---中位数 和分位数 1中位数: 中位数的计算方法: 1、根据未分组数据计算中位数 对于没分组数据,首先要排序,然后根据所在位置确定中位数。 2、由分组资料确定中位数: 例3.2 某车间实行计件工资,2005年10月120名工人的月工资资料如下表所示: 要求:试计算月工资的中位数。 解: 2.顺序数据----分位数 四分位数的位置 下四分位数 上四分位数 例3.3两个学习小组的统计学考试成绩合并如下: 要求:(1)计算前15个学生统计学考试成绩的四分位数; (2)如果增加一个学生的成绩为95分,试计算16个学生统计学考试成绩的四分位数。 解(1)QL的位置=N+1/4=15+1/4=4,即QL在第4个位置上,相应的变量值68分就是下四分位数。 Qu的位置=3(N+1)/4=3(15+1/4=12,即Qu在第12个位置上,相应的变量值85分就是上四分位数。 (2)QL的位置=N+1/4=16+1/4=4.25,即QL QL在第4.25个位置上,采用分割法,得: QL=X4+0.25x(X5-X4)=68+0.25x(72-68)=69(分) 同理,可得Qu=85.75(分) 3.1.3 数值型数据--平均数 1.平均数(均值) 2.平均数的另一种表现形式:调和平均数 习题 1、一家汽车零售店中10名员工在某个月售出的汽车数量按升序排列如下:2,4,10,10,12,12,14,15。计算售出汽车数量的 (a)均值;(b)中位数;(c)众数。 2、八名销售员售出的中央空调数按升序排列如下:5,8,11,11,11,14,16.计算这八名销售员销售量的四分位数。 1、解: (a)均值 (b)中位数 (c)众数为10. 2、解: 下面是两个总体关于年龄分布的数据,相对而言,那个总体的年龄分布分散,差异大些? 46、47、48、49、50、 51、52、53、54 8、15、20、30、50 70、80、85、92 例:假设某班有3个学习小组,统计学期中考试成绩如下表所示: 要求:计算三个小组的四分位差。 解:由题意,可得: 本 章 小 节 一、数据集中趋势的度量 ①众数、中位数、分位数、均值、几何平均数 的计算、应用条件。 ②众数、中位数、平均数的关系 二、离中趋势的度量 ①异众比率、四分位差、极差、平均差、标准差、方差、离散系数的计算、应用条件 三、标准分数的计算、特点及,应用。 偏态及其测定 峰态及其测定 含义:每一天的销售量与平均数相比, 平均相差21.58台 3.2.4 标准分数 ( standard score) 注意: ① 也称标准化值 ② 对某一个值在一组数据中相对位置的度 量 ③可用于判断一组数据是否有离群点 ④用于对变量的标准化处理 ⑤ 计算公式为 标准分数(性质) 注意: z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1。 标准分数(性质) 均值等于0 2. 方差等于1 标准化值(例题分析) 0.695 -1.042 -0.973 -0.278 -0.811 -0.556 1

文档评论(0)

youyang99 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档