第5章:数据分布的特征描述讲述.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章:数据分布的特征描述讲述

* * * * * 3.1 众数 众数是一种位置平均数,是指总体各单位数量标志出现次数最多的标志值,常用Mo表示。从分布的角度来看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数即为众数。 概念: 例如,要说明消费者需要的内衣、鞋袜、帽子等最普遍的号码,只要看哪个号码销售的量最多。 用途: 确定众数的方法: 1)各数量标志值的均匀分布,数列没有众数; 2)未分组数列或者单变量数列,众数即为出现次数最多的标志值; 3)组距数列确定中位数,先找到众数组,再计算众数; OR 《国际投融资》期末考试成绩汇总表 2011级国贸1—11班 成绩段 人数 占比 0-9分 0 0.00% 10-19分 0 0.00% 20-29分 0 0.00% 30-39分 0 0.00% 40-49分 1 0.89% 50-59分 5 4.46% 60-69分 24 21.43% 70-79分 33 29.46% 80-89分 38 33.93% 90-100分 11 9.82% 众数的特点: 1)对分布数列的代表性较强,不受极大值或极小值的影响(马云和一般人的财富的均值); 2)当分布数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分布数列没有众数; 3)如果与众数组相毗邻的上下两组的次数相等,则众数组的组中值就是众数值,反之,偏上或偏下; 4)没有利用全部数据信息,缺乏敏感性。 *关于特殊分布情况下的众数: 成绩段 人数 占比 0-9分 2 1.10% 10-19分 14 7.73% 20-29分 36 19.89% 30-39分 17 9.39% 40-49分 1 0.55% 50-59分 5 2.76% 60-69分 24 13.26% 70-79分 33 18.23% 80-89分 38 20.99% 90-100分 11 6.08% 某班期末考试成绩分布 3.2 中位数 中位数是将总体各单位数量标志值按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数量标志就是中位数,一般用字母Me来表示。 概念: 中位数的作用与算术平均数相似,也是作为研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。 说明: 确定中位数的方法: 1)未分组数列确定中位数:先排序再找中间位置 2)单变量数列确定中位数:先累计再找中间位置 3)组距数列确定众数:先找中间位置及对应的组,再计算中位数 OR 《国际投融资》期末考试成绩汇总表 2011级国贸1—11班 成绩段 人数 向上累计 向下累计 0-9分 0 0 112 10-19分 0 0 112 20-29分 0 0 112 30-39分 0 0 112 40-49分 1 1 112 50-59分 5 6 111 60-69分 24 30 106 70-79分 33 63 82 80-89分 38 101 49 90-100分 11 112 11 中位数的特点: 1)不受极大值或极小值的影响,从而在一定程度上提高了中位数对分布数列的代表性(马云和一般人的财富的均值); 2)有些离散型变量的单项数列,当次数分布呈偏态时,中位数的代表性会受到影响; 3)没有利用全部数据信息,缺乏敏感性。 3.3 众数、中位数和算术平均数的比较 三者之间的关系与次数分布有关。在次数分布完全对称时,三者都是同一值(P78,图5.1)。在次数分布非对称时,三者不再是同一值,而且有相对固定的关系(P78,图5.2,图5.3) 。 三者的关系: 根据经验:在分布偏斜程度不大的情况下,无论左偏或右偏,三者存在一定的比例关系,即众数与中位数的距离约为算术平均数与中位数的2倍。 3.3 众数、中位数和算术平均数的比较 三者的应用: 1)众数是一种位置代表值,不受极端值的影响,主要是适用于作为定类数据的集中趋势测度值,它并不适合进一步的代数运算; 2)中位数一种位置代表值,不受极端值的影响,除了数值型数据,主要是适用于作为定序数据的集中趋势测度值,它也并不适合进一步的代数运算; 3)算术平均数的含义通俗易懂、直观清晰,全部数据都要参加运算,比较可靠,主要适合作为定距和定比数据的集中趋势测度值,最容易受极端值的影响。 第四节 离中趋势指标 离中趋势指标又称标志变动度,是反映总体各单位数量标志值差异程度的综合指标,用来反映总体各单位数量标志值的变动范围和离散程度,常用的指标有极差、方差、标准差、离散系数等。 概念: 一般来讲,数量标志值分布越分散,离中趋势指标值越大,则集中趋势的代表性越小;反之,数量标志值分布越集中,离中趋势指标值越小,则集中趋势指标的代表性越大。 说明: 4.1 离中趋势指标的概念: 4.2 极差 极差也称为全距,是

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档