- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 差异量第一节 全距、四分位距、百分位距第二节 平均差第三节 方差和标准差第四节 相对差异量第五节 偏态量及峰态量;引 言
两组学生某科测验成绩:
甲组:54、63、72、74、82、88、99
乙组:67、71、73、76、79、82、84; 差异量数就是对一组数据的变异性(离中趋势)特点进行度量和描述的统计量。它反映了次数分布中数据彼此分散的程度。;第一节 全距、四分位距、百分位距;全距的应用及优缺点
概念清楚、意义明确,计算简单,但易受两极端数据的影响。不考虑中间值的差异,反应不灵敏。
只能作为差异量的粗略指标,在编制频数分布表时常用到。
;二、四分位距;图4-1 四分差与四分位数Q1、Q2、Q3之间的关系; 2.四分位距的计算方法
(1)原始数据计算法
首先将一组数据按大小顺序排列,然后用数据个数n除以4,则第(n/4+1/2)位置对应的数据为第1四分位数Q1,第(3n/4+1/2)位置对应的数据为第3四分位数Q3。; 解:按从小到大排序:
51,52,57,58,60,61,63,65,66,70,71, 74,75,77,81,86,88,90。
由于n=18,所以Q1=18/4+1/2=5,即第5个位置所对应的数据为60;Q3=18*3/4+1/2=14,即第14个位置所对应的数据为77。
将Q1与Q3代入公式,得
QD=(77-60)/2=8.5; (2)频数分布表计算法
;;;3.四分位距的应用及优缺点
优点:简明易懂,计算简便,不易受两极端数据的影响
缺点:忽略了左右50%数据的差异,不适合代数运算
当一组数据用中位数表示集中量时,就要用四分位数表示差异量,因为它们同属于百分体系。
应用条件:有特大或特小两极端数值;
有个别数值不确切、不清楚;
用等级表示的数据
;三、百分位距
百分位距是指两个百分位数之差。常用的百分位距有两种:
第90与第10百分位数之差
第93与第7百分位数之差
;;回忆百分位数计算方法;第二节 平均差; 例如,求原始数据78、83、69、75、97、88、86的平均差。;;三、平均差的优缺点
优点:意义明确,计算简单,每个数据都参加了运算,考虑到了全部的离差,反应灵敏
缺点:计算用到绝对值,不适合代数运算,因此在统计分析中应用较少。;第三节 方差和标准差; 例如:6名女童的跳远成绩(cm)148.2、123.8、123.8、142.7、130.4、133.3,求方差和标准差。; 二、方差和标准差的计算方法
1.原始数据法
为了减少计算量,可将公式4.1进行转换,使公式中参与运算的变量皆为原始数据。公式为
; 2.频数分布表计算法
;;三、方差和标准差的应用及优缺点
优点:反应灵敏;严密确定;计算简单;适合代数运算;
用样本数据推断总体差异量时,是最好的估计量;
在避免两极端数值影响方面大大超过全距;
在考虑到全部离差方面,优于四分位距;
在避免绝对值方面,优于平均差。
缺点:不易理解;
易受极端数值影响;
有个别数据模糊不清时,无法计算。;适用条件
1、一组数据的一般水平适合用算术平均数描述时,其离散程度宜用方差和标准差描述。
2、计算其它统计量时,如相关系数等,要用到标准差。
3、在推断统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。;四、各种差异量的数值关系
当总频数相当大,且频数分布呈正态时,全距、四分位距、平均差、标准差的数值存在如下关系:;第四节 差异系数; 二、差异系数的用途
1.比较不同单位资料的差异程度
例如:1975年上海市区6岁男童体重与身高为:;2.比较单位相同而平均数相差较大的两组资料的差异程度
例如:1975年上海市区两组女童的体重为:; 3.可判断特殊差异情况
根据经验,一般CV值常在5%——35%之间。
如果CV35%时,可怀疑所求得的平均数是否失去了意义;
如果CV5%时,可怀疑平均数与标准差是否计算有误;;补充:优良差异量数具备的标准 ;各种差异量数优缺点比较; 平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是
文档评论(0)