第3章节数据的特征量和统计剖析.ppt

第3章节数据的特征量和统计剖析.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
——标准差与算术平均数的百分比 (2)比较单位相同但平均数差异很大的两组数据的差异程度。 (3)判断特殊差异情况: 一般CV值通常为5%—35%。如果CV值大于35%,可怀疑所求平均数是否失去意义;如果CV值小于5%,可怀疑平均数与标准差是否计算错误。 (1)比较单位不同的数据的差异程度。 四、差异系数(变异系数) 差异系数的用途: ——描述数据分布特征的统计量。 评估频数分布是否符合正态分布时,可用偏态系数作为比较性的度量。 皮尔逊偏态系数公式——描述数据分布形态 (1)利用算数平均数与众数或中位数的距离计算偏态系数 五、偏态系数 偏态系数的计算方法: 当SK=0时,分布为对称形; 当SK0时,分布为正偏态; 当SK0时,分布为负偏态。 第三章 数据的特征量及统计分析 第一节 数据(资料)的集中量 集中量——代表一组数据集中趋势或一般水平的特征量。 一、平均数 ——又称均值,能反映一组数据的集中趋势,是一组计量资料的代表值,可作为资料代表与另一组资料相比较,以明确两组资料之间的差异状况。 包括平均数、中位数、众数 包括:算数平均数、加权平均数、几何平均数、调和平均数。 统计分析中,算数平均数应用最普遍。 1.算数平均数的计算方法 (1)直接计算法 适用于不分组的小样本资料 全部数据的总和除以数据总个数所得的商,简称均数(mean) (一) 算术平均数 (arithmetic mean) (2) 频数分布表计算法——求算术平均值的近似值 f:各组频数 X:各组组中值 k:组数 N:总频数 适用于已经编制成频数分布表的分组数据资料 组别/分 组中值(X) 频数(f) f X 90~100 94.5 8 756 80~90 84.5 16 1352 70~80 74.5 13 968.5 60~70 64.5 11 709.5 50~60 54.5 9 490.5 40~50 44.5 3 133.5 合计 60 =4410 表3-1 60个幼儿珠心算成绩平均数计算表 例3-1: (4)算术平均数的性质 A. 各观察值的总和等于平均数的n倍 B. 离均差(各观察值与平均数之差)的总和等于零 C. 离均差的平方和比各观察值与任何其它数值的离差的平方和都小,即离均差的平方和最小。 D.可加性: WN:各观察值的权重 XN:具有不同权重的观察值 加权平均数计算公式1: ——具有不同权重(比重)数据(或平均数)的平均数。 二、加权平均数、几何平均数、调和平均数 1. 加权平均数 例3-2:学生最终总评成绩为期中考试成绩占30% ,期末考试成绩占70%。某学生期中考试成绩76 分,期末考试成绩82分,计算该学生最终总评成绩是多少? N:各组数据的頻数 :各组数据的平均值 加权平均数计算公式2: 例3-3:某幼儿园大班有四个班,各班人数分别为50,52,54,48,各班绘画成绩平均分数为82,83,84,81,求全年级绘画的平均成绩。 解:利用加权算数平均数计算法计算得: 2.几何平均数 当数据较多时(n≥3),先计算对数平均数,再求GO ——N个数据连乘积的N次方根,符号为 或 GO 几何平均数的应用 ——计算入学人数增加率、学校经费增加率、阅读能力提高率等。 例:某市6年中小学教师的学历达标率分别为40%、52%、65%、72%、78%、86%,计算该市小学教师6年学历平均达标率。 解: 3.调和平均数 用于计算平均学习速度,如阅读速度、解题速度、识字速度等。 ——一组数据中每个数据的倒数的算数平均数的倒数,符号为 。 二、中位数 (median) Md 一组依大小排列的观察值中居中位置的数值。 中位数计算法: 1、不分组数据中位数计算法: 2、頻数分布表计算法: (1)中位数计算公式: Lmd:中位数所在组的下限值; Umd:中位数所在组的上限值; N:表示总频率; n1:小于中位数所在组下限的頻数总和; n2:大于中位数所在组上限的頻数总和; i:頻数分布表中的组距; fmd:中位数所在组的頻数。 (2)利用頻数分布表法计算中位数的步骤: ①计算N/2,即数据总頻数的1/2; ②依据N/2确定中位数所在组; ③查找中位数所在组的頻数、下限、上限和组距; ④计算小于中位数所在组下限的頻数总和或大于中位数所在组上限的頻数总和; ⑤将总頻数、中位数所在组的頻数、下限或上限、组距、小于中位数所在组下限的頻数总和或大于中位数所在组上限的頻数总和代入中位数计算公式。 中位数是表示数据阵列分布的中心位置,所以是数据集中趋势或中心位置的一种重要度量。 中位数不受极端数据的影响,所以常被用作偏斜数据的平均值。 三、众数 (mode) Mo —— 一组数据中出

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档