网站大量收购闲置独家精品文档,联系QQ:2885784924

第2章定量资料的统计描述课件.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章定量资料的统计描述课件.ppt

第二章 定量变量的统计描述;第一节 频数分布表与频数分布图;离散型定量变量的频数分布; 表2-1 某年某山区96名妇女产前检查次数分布;;连续型定量变量的频数分布;表2-3 120名正常成年男子血清铁含量(μmol/L)频率分布;频数分布图:在表2-3的基础上,可以绘制出图2-2,称为直方图(频率直方图)。 横轴:血清铁含量 纵轴:频率密度,即频率/组距(直条面积等于相应组段的频率)。 在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。 ;图2-2 120名正常成年男子血清铁含量(μmol/L)分布;频率分布表(图)的用途;对称分布:频数最多的组段在中央 正偏峰分布:峰向左侧偏移的分布,右侧的组段数多于左侧,为右偏峰分布。 负偏峰分布:峰向右侧偏移的分布,左侧的组段数多于右侧,称为左偏峰分布。;第二节 描述平均水平的统计指标 ;1)直接计算法:计算公式为 式中X1,X2和Xn为所有观察值,n为样本含量,∑(希腊字母,读作sigma)为求和的符号。;例2-3 某年某医院8名女性晚期肺癌患者红细胞计数(1012/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。 算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.91 (1012/L);  表2-4 加权法计算均数;2)加权频数表法:计算公式为 加权均数=2228/120=18.57(μmol/L) 直接法均数=18.61(μmol/L)。;几何均数(geometric mean,G) 适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料和等比级数资料。其频数图一般呈正偏峰分布。其直接法计算公式为 ;例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。试计算其几何均数。;加权法计算几何均数。频数表资料 例2-6 52例慢性肝炎患者的HBsAg滴度数据如表2-4。试计算滴度的几何均数。 ;;52例慢性肝炎患者的HBsAg滴度的几何均数为1∶119.74705。 ;中位数(median,M) 中位数是指将n个观察值从小到大顺序排列,位次居中的那个数值。即理论上有一半个体的数值低于中位数,一半个体的数值高于中位数。适用于各种分布的定量资料,特别是偏态分布资料。 奇数: 偶数: ;百分位数法计算中位数:频数表资料 百分位数的计算公式为 式中LX、iX和fX分别为第百分位数所在组段的下限、组距和频数,∑fL为小于各组段的累计频数, LX为总例数。即为中位数的计算公式;例2-8 试利用表2-2的频数表求例2-2中血清铁含量的中位数。 从表2-2可判断出位于“18-”这个组段。将相应数据代入式(2-8) 该组血清铁资料的中位数为18.74(μmol/L) 如果按(2-7)式计算,结果为18.99(μmol/L)。 ; 众数(mode):原指总体中出现机会最高的数值。样本众数则是在样本中出现次数最多的数值。 例2-1产前检查次数的众数为4次;第三节 描述离散趋势的统计指标; 1.极差 极差:一组变量值最大值与最小值之差。 极差不能反映所有数据的变异大小,且受样本含量的影响较大,N大,极差值相差也大,故其稳定性较差。 例2-11中三组数据的极差 A组 R=34-26=8 B组 R=36-24=12 C组 R=34-26=8;2.四分位数间距 四分位数(quartile)是把全部变量值分为四部分的百分位数,即第1四分位数(QL=P25)、第2四分位数(M=P50)、第3四分位数(QU=P75)。四分位数间距(quartile range)是由第3四分位数和第1四分位数相减而得,记为QR。它一般和中位数一起描述偏态分布资料的分布特征。;;4、标准差:;例2-13 分别计算例2-10中三组数据的标准差。 按照公式(2-15)与标准差的定义 A组 B组 C组 C组的标准差最小,B组的最大。意味着C组数据的离散趋势最小,B组的最大 ; 5.变异系数 变异系数(coefficient of variation)记为,多用于观察指标单位不同时的变异程度的比较。其计算公式为 ;例2-15 通过

文档评论(0)

danli208 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档