第四章 差异量数.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 差异量数 描述数据离散程度的统计量称为差异量数。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。 一组数据的离散程度,常常通过数据的离中趋势特点进行分析。 一、全距、百分位距(差) 和四分位距(差) 全距 R (range) 全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。 R=Xmax-Xmin 百分位差(百分位距) 百分位差是指两个百分位数(percentile)之差。 百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。常用Pp或Pm表示。 第P百分位数指在其值为P的数据以下,包括分布中全部数据的的百分之p或m。 常用的百分位距有两种: P90-P10和 P93-P7。 用几个百分位距能较好地反映一组数据的差异程度。 计算公式 公式中:fbp为某一百分位数所在组下限以下的累积 频数    fp为某一百分位数所在组的频数    Lbp为某一百分位数所在组的精确下限 四分位距 四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为 其中: 二、平均差 平均差(average deviation 或者 mean deviation)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD或MD表示。 本书中均以AD表示。 原始数据计算公式 次数分布表计算公式 三、方差和标准差 方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。 标准差(standard deviation)是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差用 表示。 标准差和方差是描述数据离散程度的最常用的差异量。 1.方差和标准差的定义 2.方差和标准差的计算公式 未分组数据 样本方差和标准差 未分组数据 表5-1 52名学生数学成绩方差和标准差计算表 3.总标准差的合成 方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。 需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。 计算公式 4.方差和标准差的性质 方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性: 方差与标准差的性质 5 方差与标准差的意义 方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。他们是统计描述和统计推断分析中最常用的差异量数。在描述统计部分,只需要标准差就足以说明一组数据的离中趋势 优点:反应灵敏;计算公式严密;容易计算;适合代数运算;受抽样变动小;简单明了。 具有数学上的优越性,特备适当已知一组数的平均数与标准差后,就可知道落在平均数上下各一个标准差,两个标准差或个标准差范围之内的数据所占的百分比。 四.相对差异量 1.差异系数的概念及计算公式 差异系数(coefficient of variation)是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV表示,其计算公式为 2.差异系数的作用 比较不同单位资料的差异程度 比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况 根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。 例1:比较计量单位不同的数据资料的差异程度 1975年上海市区6岁男童体重与身高数据: 例2:比较单位相同而平均数相关较大的两组资料的差异程度。 3.差异系数的应用条件 差异系数主要应用于平均数不等于零的连续数据。 学科成绩可以勉强计算差异系数。 优良差异量数应具备的标准 各种差异量数的关系 * * 因以全距表示数据离散程度时受极端数影响,取消分布两端10%的数据,即P90-P10 指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比 四分位差也视为百分位差的一种,指在一个次数分配中,中间50%的次数的距离的一半。 百分位数 百分位差 四分位差 Pp为所求的第P个百分数 Lb百分位数所在组的精确下限 f为百分位数所在组的次数 Fb为小于Lb的各组次数的和 N为总次数 i为组距 PR为所求的第P个百分等级 X为给定的原始分数 Lb为该分数所在组的精确下限 f为该分数所在组的次数

文档评论(0)

awang118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档