2011CM5Y医学统计学方法.ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2013.10.31 TYC SAS统计分析 教案 三、离散趋势的描述 本章一部分讲授的频数分布有集中趋势和离散趋势两个特征,说明描述资料的全面变化规律需把二者结合起来。通过下例可说明这个问题。 例9-8a 现有3组健康女大学生的口腔温度测得值如下,试分析其集中趋势和离散趋势。 1组 36.8 36.9 37.0 37.1 37.2 2组 36.5 36.9 37.0 37.1 37.5 3组 36.5 36.7 37.0 37.3 37.5 前面三组学生的平均口腔温度都是37.0(℃),即集中趋势相同,但能说明三组数据的变化规律相同吗?我们通过把上述三组数据转化成数轴上的点看看这个问题。 显然三组学生的口腔温度值参差不齐的程度都各不相同。第1组数值较为集中,第2、3组数值较为发散。说明三组数据的离散趋势是不相同的。 统计学中常用描述变量值的离散程度(亦称变异程度)的指标有:全距、四分位数间距、方差、标准差和变异系数。 ㈠ 全距 全距亦称极差,用R表示。全距是所有变量 值中最大值与最小值之差,它反映了变量值的变异范围大小。全距大变异程度大;全距小变异程度小。 例9-8a中,R1=37.2-36.8=0.4、R2=1.0、 R3= 1.0。说明第1组数据的离散趋势比第2、3组小。 全距计算简便,但粗略,不稳定。 例9-8a中,R2=R3=1.0,并不 能说明两组数据的离散趋势一样。 全距易受极大或极小值的影响。 ㈡ 四分位数间距 四分位数(quartile)是特定的百分位数。第25百分位数(P25)称为下四分位数(lower quartile),常用QL表示;第75百分位数(P75)称为上四分位数(upper quartile),常用QU表示。四分位数间距(InterQuartile Range, IQR)即QU与QL之差,用IQR表示。 四分位数间距适用于偏态分布资料,尤其是 有特大或特小值;分布末端无确切数值的资料。 例9-8b 求例9-7资料的四分位数间距。 在前面百分位数中已求得P25 =48.15,P75 =100.00, 则四分位数间距为: 四分位数间距虽比全距稳定,但仍未考虑所 有变量值的变异程度。 ㈢ 方差 方差(variance)是常用的变异指标。总体方差用σ2表示,样本方差用S2表示。总体方差往往未知,常用样本方差来估计。 方差的计算公式为: 式(9-8) 式(9-9) William Sealy Gosset (1876-1937) Student 英国统计学家Gosset建议用n-1代替n计算S2,可证明S2总在σ2的周围(无偏估计)。n-1称为自由度(degree of freedom )。 称为离均差平方和 In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary. ㈣ 标准差 标准差(standard deviation)是方差的平方根。因方差使度量衡单位变成平方,故对方差开平方根恢复原单位就得到标准差。总体标准差用σ表示,样本标准差用S表示。计算公式为: 式(9-10) 式(9-11) 离均差平方和 常用SS或lxx表示。其展开式为: 把上述展开式代入式(9-11)则得到直接由原始数据求标准差的公式: 式(9-13) 式(9-12) 式中 是变量值平方的和; 是变量值和 的平方。 上式为直接法的计算公式,下式为加权法的: 式(9-14) 式中X 是各组段的组中值,f 是相应的频数。 例9-8c 求例9-8a三组数据的各自标准差。 求第1组的S1: 同理得: 例9-9 用加权法求例9-1数据的标准差。 由表9-3的(2)、(4)、(5)栏可得: 代入式(9-14)得: 标准差适用于描述对称分布,尤其是正态分布或近似正态分布的数值变量资料的变异程度。 ㈤ 变异系数 变异系数(coefficient of variation)常记为CV。它被定义为标准差与均数之比,即 式(9-15) 变异系数适用于比较度量衡单位不同的或均数相差悬殊的多组资料的变异程度。 例9-10a 某地7岁女孩身高均数为120.25cm,标准差为4.42cm;胸围均数为56.63cm,标准差为2.91cm

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档