- 1、本文档共237页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章 统计数据的静态分析 4.1 总量指标 4.2 相对指标 4.3 平均指标 4.4 标志变异指标 4.5 数据分布的形态 本章学习目的 本章重点与难点 重点:总量指标的种类、相对指标的数值表现形式、种类及计算方法;平均指标的种类,算术平均数、调和平均数和几何平均数的计算方法、应用场合 ;众数和中位数概念和特点;变异指标的作用、应用场合和计算方法。 什么是态数列 静态数列——又称变量数列,是指某一时间在分组的基础上,同时列出总体的次数和比率所构成的数列。 静态三数(图) 数据描述的数值方法 4.1 总量指标 相对数 【例】 下周见作业:课后练习计算题 数据描述的数值方法 第二模块 4.3平均指标 算术平均数(例子) 某企业的工会随机调查了20名工人2005年6月加班的小时数,结果如下: 该组数据算术平均数等于(13+18+ … +12)/20=11.6(小时)。 【练习2】假设某饮料公司7月份对几个零售店进行了一次调查,得到如表4-3所示数据,计算饮料销售量的均值 算术平均数的性质 1、 所有的定量数据都有算术平均数。 2、计算算术平均数时使用了所有数据。 3、一组数只有一个均值。 4、各变量值与均值的离差之和等于零。 总结 1.算术平均数的性质 1、 所有的定量数据都有算术平均数。 2、计算算术平均数时使用了所有数据。 3、一组数只有一个均值。 4、各变量值与均值的离差之和等于零。 2 中位数(Median) 一组数据按大小顺序排列后,处在数列中点位置的数值。 特点: 对一组数据是唯一的。 不受极端值的影响。 主要用于顺序数据,也可用数值型数据,但不能用于分类数据。 3 众数(Mode) 一组数据中出现次数最多的变量值。 主要特点: 不受极端值的影响。 有的数据无众数或有多个众数。 对未分组定量资料很少使用。 众数的不惟一性 众数、中位数和算术平均数的关系 小结:平均数、中位数、众数的特点 算术平均数 : 易受极端值影响(使用了全部数据) 数学性质优良,主要用于数值型数据 数据对称分布或接近对称分布时应用 中位数: 不受极端值影响 数据分布偏斜程度较大时应用;主要用于顺序数据 众数: 不受极端值影响 不具有惟一性 数据分布偏斜程度较大时应用;主要用于分类数据 四分位数(Quartile) 数据按大小顺序排序后把分割成四等分的三个分割点上的数值 。 在实际应用中四分位数的计算方法并不统一(数据量大时这些方法差别不大)。对原始数据: SPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。 Excel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。 如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。 四分位数计算(例子) 排序后的数据: 2,5,6,7,8,9, 10,12,15,16 4.4 标志变异指标 离散程度 反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度。 不同类型的数据有不同的离散程度测度指标。 (2) 四分位距(Inter-Quartile Range, IQR) 等于上四分位数与下四分位数之差 反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。 不受极端值的影响。 可以用于衡量中位数的代表性。 方差和标准差(variance and standard deviation) 数据离散程度的最常用测度值 反映各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(标准差),记为?2(?);根据样本数据计算的,称为样本方差(标准差),记为s2(s) 总体方差和标准差 (Population variance and Standard deviation) 未分组数据 样本方差和标准差 (sample variance and standard deviation) 未分组数据 方差的计算公式 自由度 (degree of freedom) 自由度的概念由统计学家R.A Fisher提出 是指数据个数与附加给独立的观测值的约束或限制的个数之差 从字面涵义来看,自由度是指一组数据中可以自由取值的个数 当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值 按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k 自由度 (degree of freedom) 样本有3个数值,即x1=2
文档评论(0)