- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 差异量第一节 全距、四分位距、百分位距第二节 平均差第三节 方差和标准差第四节 相对差异量第五节 偏态量及峰态量 补充:优良差异量数具备的标准 各种差异量数优缺点比较 适用条件 1、一组数据的一般水平适合用算术平均数描述时,其离散程度宜用方差和标准差描述。 2、计算其它统计量时,如相关系数等,要用到标准差。 3、在推断统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。 四、各种差异量的数值关系 当总频数相当大,且频数分布呈正态时,全距、四分位距、平均差、标准差的数值存在如下关系: 中位数上下各一个四分位距之间包括50%的总频数; 算数平均数上下各一个平均差之间包括57.51%的总频数; 算数平均数上下各一个标准差之间包括68.26%的总频数; 第四节 差异系数 一、差异系数的概念 差异系数是一组数据的标准差与算数平均数的比率,又称相对差异量,它是没有单位的相对数。用符号CV表示。公式为 由上式可见,差异系数就是以平均数为单位,视标准差占平均数百分比的大小来衡量差异的程度。差异系数越大,表明离散程度越大;差异系数越小,表明离散程度越小。 二、差异系数的用途 1.比较不同单位资料的差异程度 例如:1975年上海市区6岁男童体重与身高为: 平均数 标准差 体重 19.39kg 2.16kg 身高 115.87cm 4.86cm 其差异系数为: 体重 身高 可见,体重的差异大于身高的差异。 2.比较单位相同而平均数相差较大的两组资料的差异程度 例如:1975年上海市区两组女童的体重为: 平均数 标准差 2个月组 5.45kg 0.62kg 6岁组 19.02kg 2.12kg 2个月组 6岁组 可见,两组女童体重的离散程度大体相同。 3.可判断特殊差异情况 根据经验,一般CV值常在5%——35%之间。 如果CV35%时,可怀疑所求得的平均数是否失去了意义; 如果CV5%时,可怀疑平均数与标准差是否计算有误; 三、差异系数的应用条件 由公式可看出,当平均数为零时,此时无意义。从测量的理论来说,只有等比量表的测量结果才使平均数等于零不可能。也就是说,用来测量的量尺,即具有等距单位,又具有绝对零点,这时所测量出的数据其平均数才不可能等于零,才可以计算差异系数。 鉴定一个差异量数,是不是一个良好的统计指标,主要看是否具备以下标准: (1)应该是根据客观数据资料获得的,而不是人为的主观估计决定的; (2)应该是根据全部观测值计算得出来的,而不是个别数据计算的结果,否则就不能代表全部数据的分布特征; (3)应当简明,容易理解,不应过于带有数学抽象性质; (4)计算应该方便、容易、迅速; (5)应该最少受到抽样变动的影响(样本的稳定性),在反复取样的过程中具有相对恒常性; (6)应该能够采用代数方法计算。 * LOGO * LOGO * LOGO 引 言 两组学生某科测验成绩: 甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84 表示一组数据变异程度或离散程度的量称为差异量。差异量越大,表示数据分布的范围越广,越不整齐;差异量越小,表示数据分布的越集中,变动范围越小。常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差、差异系数等。 差异量数就是对一组数据的变异性(离中趋势)特点进行度量和描述的统计量。它反映了次数分布中数据彼此分散的程度。 第一节 全距、四分位距、百分位距 一、全距 全距是一组数据中最大值与最小值之差,又称极差。用R表示。 如上例:两组学生某科测验成绩: 甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84 甲组的全距为R=99-54=45 乙组的全距为R=84-67=17 说明甲组比乙组的离散程度大。 频数分布表求全距的方法是:最大一组与最小一组组中值之差。 全距的应用及优缺点 概念清楚、意义明确,计算简单,但易受两极端数据的影响。不考虑中间值的差异,反应不灵敏。 只能作为差异量的粗略指标,在编制频数分布表时常用到。 二、四分位距 1.四分位距的概念 四分位距是指在一个频数分布中,中间50%的频数的全距之半,也就是第3四分位数Q3(第75百分位数)与第1四分位数Q1(第25百分位数)之差的一半。所谓第3四分位数是指在这一点的下端有占总频数75%的数据,在其上端有占总频数25%的数据;所谓第1四分位数中指在这一点的下端有占总频数25%的数
文档评论(0)