- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定量资料的统计描述2
医学统计学 Medical Statistics 三种平均数的特点 1、算术平均数 根据全体观察值计算得到,计算较为简单。但对于极端值或偏态分布资料显得不稳定。 2、几何均数 也根据全部观察值计算得到,只适宜于等比资料。 3、中位数 将全部观察值由小到大顺序排列后,取中间位置所对应的量值。不受极端值的影响,但不如均数精确。 二、离散趋势的描述 例、三组同性别、同年龄儿童的体重(kg)数据如下,试分析其集中趋势和离散程度。 甲组 乙组 丙组 仅用集中趋势不能全面描述数据分布的规律。还需要用一些统计指标来反映其变异程度的大小。 描述离散程度的常见指标有:全距、四分位数间距、方差、标准差及变异系数,其中以标准差和变异系数最为常用。 (一)全距(range) 全距也称作极差,用大写字母R表示; 等于一组变量值中最大值与最小值之差; 反映的是资料分布的范围; 全距越大,说明数据的变异程度越大;全距越小,说明数据的变异程度越小。 例、三组同性别、同年龄儿童的体重(kg)数据如下,试分析其集中趋势和离散程度。 分别求出三组的极差 : 甲组:R=34-26= 8(Kg) 乙组:R=36-24= 12(Kg) 丙组:R=34-26= 8(Kg) 优点:方法简单 缺点: ① 不灵敏:反映最大值与最小值之间的差异,当组内其它数据变动时,全距不变。 ② 不稳定:当样本例数增加时,获得过大或过小极端变量值的可能性增大,因而全距可能会变大。 全距对变异度的描述很粗略,用来初步反映变异的大小。 (二)四分位数间距 百分位数(percentile)指将观察值从小到大排列后,处于第x百分位置上的数,用符号Px表示。 一个百分位数可将一组变量值分为两部分,理论上有x%的变量值比它小,有(100-x)%的变量值比它大。 四分位数(quartile)是两个特定的百分位数:第25%分位数P25,和第75%分位数P75,分别记为QL和QU。 四分位数间距(interquartile range)定义为:QL与QU间的差距,其间包括了全部观察值从小到大排列中间的一半,而不包括两端。 与全距相比,四分位数间距受极端值的影响小,比全距稳定。 四分位数间距越大,说明变异度越大。 从四分位数间距的特点可以看出,它适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。 (三)方差(variance)和 标准差(standard deviation) 1、总体方差和标准差 应全面考虑每个观察值的变异情况。 (X-?)→ ∑(X-?)=0 →∑(X-?)2 → → ∑(X-?)2,离均差平方和(sum of squares about the mean,简记为SS) 总体标准差(standard deviation,简记为SD) 标准差和方差均反映个体变异,个体变异度越大,标准差和方差也越大,反之亦然。 2、样本方差和标准差 实际工作中得到的是样本资料,总体均数往往是未知的,只能用样本均数作为 ? 的估计值,因此可用 代替(X-? )2、用样本例数n代替N。 1908年英国统计学家Gosset提出,用n-1代替n作为校正。 自由度 其中,n-1称为自由度。自由度就是允许自由取值的个数。一般情况下,自由度=变量数-限制条件数。上面式子分子中有n变量,限制条件只有一个,就是 ,所以这n项只有n-1个自由度。 例、三组同性别、同年龄儿童的体重(kg)数据如下,试分析其集中趋势和离散程度。 求甲、乙、丙三组数据的标准差。 甲组:n =5, s =3.16(kg) 乙组:n =5, s =4.74(kg) 丙组:n =5, s =2.92(kg) 标准差直接地、总结地、平均地描述了变量值的离散程度。 在同质的前提下,标准差越大表示变量值的离散程度越大,即变量值的分布分散、不整齐、波动较大; 反之,标准差越小表示变量值的离散程度越小,即变量值的分布集中、整齐、波动较小。 (四)变异系数(coefficient of variation) 变异系数,简记为CV,是标准差s与均数之比 。 变异系数派生于标准差,它的应用价值在于排除了平均水平的影响,而且消除了单位。 常用于:① 比较度量衡单位不同的两组或多组资料的变异度。② 比较均数相差悬殊的两组或多组资料的变异度。 例 某地20岁男子100人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.7kg,标准差为4.96kg,试比较身高
文档评论(0)