第三章 变量分布特征的描述8.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 变量分布特征的描述8

三、位置平均数 (一)中位数与分位数 1.中位数(Median)的含义 中位数是将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据就是中位数。中位数用Me表示。 2.中位数的计算 A.对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为: (1)由单项数列确定中位数,直接按 公式求出中位数所在组的位置,计算累计次数确定中位数所在的组,组值即是中位数。 例3.17:某企业50名工人加工零件数如表所示,计算50名工人日加工零件数的中位数。 (2)由组距数列确定中位数,应先按 公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。 4.分位数(分位点, quantile ) 分位数是将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。常用的分位数有四分位数、十分位数和百分位数 (二)众数(Mode) 1.众数的含义 众数是指总体中出现次数最多的那个标志值。用Mo表示。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。理性理解:简单的说,就是一组数据中占比例最多的那个数。 众数也不受数列中极端变量值的影响,它可反映总体各单位某一标志值的集中趋势。 2.众数的计算(众数的不唯一性) 无众数 原始数据: 10 5 9 12 6 8 A.众数的值与相邻两组频数的分布有关 (1)众数不受分布数列的极大或极小值的影响。 (2)当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。 (3)如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,则众数在众数组内会偏向该组下限;如果与众数组比邻的下一组的次数较多,则众数在众数组内会偏向该组上限。 (4)缺乏敏感性。 (三)中位数、众数和算术平均数的关系 1.在对称分布(即正态)时 第二节 离中趋势的描述 全距、平均差、方差和标准差、变异系数 二、离散指标的测度 R甲=100-60=40(分) R乙=82-78=4(分) (四)平均差(Average Deviation ) 例3.22:某厂按月收入水平分组的组距数列如表所示,计算平均差。 (五)方差Variance与标准差(Standard Deviation) 反应灵敏,随任何一个数据的变化而变化; 一组数据的方差和标准差有确定的值; 适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差; 用样本数据推断总体差异量时,方差和标准差是最好的估计量。 (六)离散系数(Coefficient of Variation) 根据例3.24数据,算得姚明、戴维斯、保罗的离散系数分别为: 第三节 分布形状的描述 1.常用指标 2.离散指标作用 衡量和比较平均指标的代表性。变异指标越大,平均指标的代表性越小;变异指标越小,平均指标的代表性越大 反映经济活动过程的均衡性、稳定性和节奏性 为统计推断提供依据 (一)全距 1.定义:全距(R)也称为极差,是指总体各单位的两个极端标志值之差。  2.计算公式:R=最大标志值-最小标志值 3.特点 (1)简明 (2)只反映变异范围 (3)只受两个数值影响,最容易受极端值影响 小贴士:Excel中,通过组合使用MAX和MIN函数来计算极差。 生活中的极差:水力发电,血压,落差 例3.20:有两个学习小组的统计学成绩为 第一组:60,70,80,90,100 第二组:78,79,80,81,82 两组的统计成绩的平均分都是80分,哪一组的分数比较集中呢? 如果用全距指标来衡量,则第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度。 根据组距计算极差,是测定标志变动度的一种简单方法,但受极端值的影响,因而它往往不能充分反映社会经济现象的离散程度。 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。在正常生产条件下,全距在一定范围内波动,若全距超过给定的范围,就说明有异常情况出现。因此,利用全距有助于及时发现问题,以便采取措施,保证产品质量。 (二)四分位差 1.定义:四分位差,也称为内距或四分间距 ,用 表示 ,是四分位数中第一个四分位数与第三个四分位数之差。 2.计算公式 31 32 33 47 48 54 51 54 15 39 16 49 20 31 29 我爱幽兰异众芳,

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档