- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《统计问答
1.用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数,血铅含量等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile)是一种位置指标,以PX表示,一个百分位数PX将全部观察值分为两个部分,理论上有X%的观察值比PX小,有(100-X)%观察值比PX大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。
均数X ̄ 几何均数G 中位数M 百分位数PX
适用资料
单峰正态分布 等比资料
对数正态分布 各种分布,偏态分布,不确定值 各种分布,偏态分布,不确定值 计算特点 用到全部数据 用到全部数据 中间数据 部分数据 极端值影响
敏感 敏感,不能同时有正负数,观察值不能为0
不敏感
不敏感
2. 常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。
四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=QU-QL ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。
极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。
方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。
变异系数(coefficient of variance,CV)亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
极差
R 四分位数间距
Q 方差 标准差
s 变异系数CV 适用资料 任何分布 常用于偏态分布 正态分布 度量衡单位不同,均数相差悬殊 计算特点 用到两端数据 用到中间数据 用到全部数据 用到全部数据 极端值的影响 敏感 不敏感 敏感 敏感 正态分布资料:均数加减标准差。偏态分布资料:中位数加减四分位数间距
3. 常用的相对数指标有:比,构成比和率。
比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。比=A/B
率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。率=实际发生某现象的观察单位数/可能发生该现象的观察单位数
构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。构成比=事物内部某一组成部分的观察单位数/同一事物各组成部分的观察单位总数
4.分析时不能以构成比代替率的原因和举例。
构成比只能说明事物内部各组成部分的比重或分布,并不能说明某现象发生的概率和强度。
如某区急性传染病发生数的构成比最低,但不能说明该区急性传染病发病在全市是最低的。只是因为该区的人口数最少,所以急性传染病发生数少于其他区,致使比重最低。
5.正态分布的特征:
⑴单峰分布,高峰位置在均数处。总体中位数等于均数
⑵以均数为中心左右对称。
⑶正态分布取决于两个参数:即均数和标准差
位置参数:均数。均数越大,则曲线沿横轴向右移动。
形态参数:标准差。表示数据的离散程度。若标准差小,则曲线形态瘦高,否则矮胖。
⑷正态曲线下的面积分布有一定的
文档评论(0)