- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4,数据的集中趋势及描述课案
数据的集中趋势及其描述
青岛大学师范学院
杨慧娟
青岛市统计局5月25日发布2015年在岗职工年平均工资水平。2015年,全市在岗职工年平均工资53715元,比2014年增加5262元,名义增长10.9%;扣除物价因素,实际增长9.5%。
非私营单位在岗职工69465元
其中,城镇非私营单位在岗职工年平均工资69465元,比2014年增加7361元,名义增长11.9%,扣除物价因素实际增长10.5%。城镇私营单位在岗职工年平均工资41737元,比2014年增加3667元,名义增长9.6%,扣除物价因素实际增长8.3%。
§1 众数和中数
一、众数
什么是众数?
众数又称范数、密集数、通常数等,常用M0来表示。它表示的是一组数据中出现次数最多的那个数值。
(一)众数的计算方法
1. 直接观察法
不能用观察法看出众数时,这时有下面的方法:
组别
组中值
次数
80—84
82
5
75—79
77
4
70—74
72
13
65—69
67
10
60—64
62
11
55—59
57
3
50—54
52
2
合计
48
2. 用公式求众数
金氏插补法:
1、众数的值与相邻两组频数的分布有关;
2、相邻两组的频数相等时,众数组的组中值即为众数;
3、相邻两组的频数不相等时,众数采用金氏插补法近似公式计算;
4、该公式假定众数组的频数在众数组内均匀分布。
众数(众数的不唯一性)
无众数原始数据: 10 5 9 12 6 8
一个众数原始数据: 6 5 9 8 5 5
多于一个众数原始数据: 25 28 28 36 42 42
小结:关于众数
集中趋势的测度值之一
出现次数最多的变量值
不受极端值的影响,但是易受分组的影响
可能没有众数或有几个众数
主要用于定类数据,也可用于定序数据和数值型数据
所以,在统计实践中,当一组数据出现不同质的情况,或分布中出现极端数据时,一般可用众数作为集中量的粗略估计。
二、中位数
中位数(Md)又称中数、中点数、中值,它是指位于一组数据大小序列中间位置的那个数值。
中位数是一种按其在数列中的特殊位置而决定的平均数。把总体各单位标志值按大小顺序排列后,处在中点位次的标志值就是中位数,它将全部标志值分成两个部分,一半标志值比它大,一半标志值比它小,而且比它大的标志值个数和比它小的标志值个数相等。
(一)中位数的求法
1. 未分组数据中中位数的求法
当总体位数N为奇数时,中位数就是中位数位次上的那个数据;当 N为偶数时,中位数是中位数位次上2项数据的算术平均数。
2. 分组数据中中位数的求法
例,课本46页
中位数最大的特点是:它是序列中间1项或2项的平均数,不受极端值的影响,所以在当一个变量数列中含有特大值与特小值的情况下,采用中位数较为适宜。正式由于中位数的这一特点,在统计研究中,当遇到掌握统计资料不多而且各标志值之间差异程度较大或频数分布有偏态时,为避免计算标志值所得的算术平均数偏大或偏小,就可利用中位数来表示现象的一般水平。
集中趋势的测度值之一;
排序后处于中间位置上的值;
不受极端值的影响;
主要用于定序数据,也可用数值型数据,但不能用于定类数据;
各变量值与中位数的离差绝对值之和最小,即
§2 算术平均数
算术平均数,一般简称为平均数,或均数,均值,有时也被称为数学期望。
一、总体平均数与样本平均数
1. 总体平均数
2. 样本平均数
原始样本数据:10,5,9,13,6,8
(一)算术平均数的基本性质:
(1)每个观测值都加上一个相同的值d,最后的平均数也加上一个d.
(2)每个观测值都乘上一个相同的值c,最后的平均数也乘上一个c.
(3)每个观测值都乘上一个相同的值c,再加上一个相同的值d,最后的平均数等于原平均数乘上一个c,再加上一个d.
算术平均数可以进行代数运算。这是众数,中位数不具有的性质。
(4)观测值与平均数的差的总和为零,即
(差的总和等于总和的差)
(5)观测值与任意常数c的离差平方和,不小于观测值与平均数的离差平方和,即
(二)算术平均数的优缺点
1. 集中趋势的测度值之一;(反应灵敏、简明易解、计算简便)
2. 最常用的测度值;
3. 一组数据的均衡点所在;
4. 易受极端值的影响;
5. 用于数值型数据,不能用于定类数据和定序数据。
众数、中位数和算术平均数三者之间的关系:
(1)也是众数皮尔逊经验法:
例:若已知一组数据的众数为75.3,中位数为75.9,求其平均数。
(2)他们之间
文档评论(0)