第三章变量分布特征的描述 (3).ppt

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布形状的描述 一、分布形状和形状指标 形状指标就是反映变量分布具体形状,即左右是否对称、偏斜程度与陡峭程度如何的指标。 对称性 陡峭性 反映变量分布偏斜程度的指标,称为偏度系数 反映变量分布陡峭程度的指标,称为峰度系数 偏度的测定是通过计算偏度系数来实现的,通常用 来表示。 偏度系数的计算主要有以下三种方法: (一)利用算术平均数与众数或中位数的离差求偏度系数 二、偏度系数 = 一般情况下,偏度系数的变动范围为(-3,3)。当﹥时,为正值,变量分布属于正偏;当﹤时,为负值,变量分布属于负偏;当=时,为0,变量分布属于无偏(即对称分布)。的绝对值越接近于3,表明变量分布的偏斜程度越严重;的绝对值越接近于0,表明变量分布的偏斜程度越轻微。 2.偏度系数 (m3——三阶中心矩) 定义M=∑(X-A)k/n为变量X关于A的k阶矩。 当A=0,即以原点为中心,上式称为““K阶原点矩”。 K=1,2,3时,有: 一阶原点矩M1=∑(X-0)1/n=∑X/n 二阶原点矩M2=∑(X-0)2/n=∑X2/n 三阶原点矩M3=∑(X-0)3/n=∑X3/n 当A= ,即以 为中心,上式称为“K阶中心矩”。 K=1,2,3时,有: 一阶中心矩 二阶中心矩 三阶中心矩 所以,m3可以测定偏度。为消除量纲,转变为系数,再除以σ3。 0负偏态 =0对称分布 0正偏态 计算标准分 即将原始分数X经过线性变换转变为标准分Z。反映各原始分的平均数为中心的相对位置。 X O 任何原始分在总体中的位 置,用Z倍的σ来测定。 * Location (Position) Concerned with where values are concentrated. Variation (Dispersion) Concerned with the extent to which values vary. Shape Concerned with extent to which values are symmetrically distributed. * * * * * * * * * * * * * * * 33 * 组距数列确定众数的方法 下限公式 上限公式 众数特点 1.众数不受分布数列的极大或极小值的影响. 2.当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。若将无众数的分布数列重新分组或各组频数依序合并,又会使分配数列再现出明显的集中趋势。 3.如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,而下一组的次数较少,则众数在众数组内会偏向该组下限;如果与众数组比邻的上一组的次数较少,而下一组的次数较多,则众数在众数组内会偏向该组上限。 4.缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。 (三)中位数、众数和算术平均数的关系 在对称分布(即正态)时 在右偏时 在左偏时 适度偏态时 众数与算术平均数的距离约为中位数与算术平均数距离的3倍 对称分布 右偏分布 左偏分布 一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是: 例: 第四节 标志变异指标 一、离中趋势和离散指标 离中趋势,就是变量分布中各变量值背离中心值的倾向。如果说集中趋势是总体或变量分布同质性的体现,那么离中趋势就是总体或变量分布变异性的体现 。 离散指标就是反映变量值变动范围和差异程度的指标,即反映变量分布中各变量值远离中心值或代表值程度的指标,亦称为变异指标或标志变动度指标。 离散指标是衡量平均指标代表性的尺度。一般来讲,数据分布越分散,变异指标越大,平均指标的代表性越小;数据分布越集中,变异指标越小,平均指标的代表性越大。 常用的变异指标有:全距、平均差、方差和标准差、变异系数。 变异指标的作用 用变异指标衡量和比较平均指标的代表性。 用变异指标反映经济活动过程的均衡性、稳定性和节奏性。 变异指标为统计推断提供依据。 二、离散指标的测度 (一)全距(Range) 全距(R)也称为极差,是指总体各单位的两个极端标志值之差,即:    R=最大标志值-最小标志值 特点(优点与缺点) (1)简明;(2)只反映变异范围;(3)只受两个数值影响;最容易受极端值影响。没有反映中间数值的影响,没有反映分布情况。 例1:有两个学习小组的统计学开始成绩分别为: 第一组:60,70,80,90,100 第二组:78,79,80,81,82 很明显,两个小组的考试成绩平均分都是80分,但是哪一组的分数比较集中呢? 如果用全距指标来衡量,则有 R甲=10

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档