研究生统计学 集中和离散趋势的描述.pptVIP

研究生统计学 集中和离散趋势的描述.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二节 集中趋势的描述 集中趋势的描述(Central tendency) 平均指标(平均数) 平均指标(平均数):是用于描述数值变量资料平均水平或中间位置的一类指标。根据它们的作用和特点不同平均数可分为算术平均数、几何平均数、中位数、众数等。 1、算术均数(arithmetic mean),简称 均数 (mean) 2、几何均数(geometric mean) 3、中位数 (median) 4、众数(mode) 一、算术均数(概念要点) 1、描述集中趋势的指标之一 2、适用于对称分布特别是正态分布的资料 3、一组数据的均衡点所在 4、易受极端值的影响 算术均数(计算公式) 算术均数的数学性质 1、各变量值与均数的离差之和等于零 二、几何均数(概念要点) 1、描述集中趋势的指标之一 2、N 个变量值乘积的 N 次方根 3、适用于特殊的数据(等比资料或对数分布资料) 4、可看作是均值的一种变形 几何均数(geometric mean) 频数表资料的几何均数计算公式 对这些发铜原始观察值进行对数变换整理成频数表后,发现其对数值呈单峰对称分布,故采用几何均数描述其集中趋势。 三、中位数 1、是将一批数据从小至大排列后位次居中的数值,符号为 M,反映一批观察值在位次上的平均水平。 中位数的特点 不受极端值的影响 可用于各种分布的资料。尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。 各变量值与中位数的离差绝对值之和最小,即 未分组数据的中位数 (直接法) 未分组数据的中位数 (7个数据的算例) 原始数据: 87 90 91 92 95 96 108 位 置: 1 2 3 4 5 6 7 未分组数据的中位数 (8个数据的算例) 原始数据 87 90 91 92 95 96 108 171 位 置 1 2 3 4 5 6 7 8 分组数据的中位数 (频数表法) 1、确定中位数所在的组 2、采用下列近似公式计算: 频数表资料的中位数 众数、中位数和均数的关系 集中趋势指标小结 第三节 离散趋势的描述 离散趋势指标 反映数据的离散度(Dispersion)。即个体观察值的变异程度。常用的指标有: 1、极差与四分位数间距 2、方差 与标准差 3、变异系数 (一)极差(概念要点及计算公式) 1、 一组数据的最大值与最小值之差 2、离散程度的最简单指标 3、易受极端值影响 4、未考虑数据的分布 5、计算公式为: (二)四分位数(概念要点) 排序后处于25%和75%位置上的值 四分位数间距特点 1. 描述离散程度的指标之一 2. 也称为内距或四分位差 3. 是上四分位数与下四分位数之差 四分位数间距= QU - QL 4. 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 附:百分位数 百分位数(percentile):也是一个位置指标,常用Px表示。它是表示将一组由小到大的观察值均分为100等份后,每一个百分分割值。 例如P5表示:5%的观察值比这个值小,95%的观察值比这个值大。 百分位数计算公式 百分位数应用 确定医学参考值范围 (reference range): 如95%参考值范围=P97.5-P2.5; 表示有95%正常个体的测量值在此范围。 中位数M与四分位数间距一起使用,描述偏态分布资料的特征。 (三)方差和标准差(概念要点) 1、描述离散程度最常用的指标 2、反映了数据的分布 3、反映了各变量值与均数的平均差异 4、根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 总体方差和标准差(计算公式) 样本方差和标准差(计算公式) 未分组数据: 自由度(degree of freedom) 1、自由度是数学名词,指一组数据中可以自由取值的数据的个数 2、在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。 3、当样本数据的个数为 n 时,若样本均值 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。 4、例如,样本有3个数值,即x1=2,x2=4,x3=9,则 =5。当 =5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值。 几何标准差

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档