- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
临床试验相关统计知识教材 第二讲1
第十四章 数值变量 的统计描述 要求: 掌握★★★★ 1.描述数值变量资料集中趋势常用指标(均数、几何均数、中位数)的计算及适用条件。 2.描述数值变量资料离散趋势常用指标(极差、四分位间距、方差、标准差、变异系数)的计算及适用条件。 3.参考值范围的估计 熟悉★★★ 1. 频数分布表的编制方法 2.正态分布的概念、特征 第一节 频数分布(frequency distribution) 目的:了解数值变量的分布。 连续型数值变量资料频数分布 频数表(frequency table)的编制: 求极差(range):R=Max-Min 确定组段数、组距和组段 组段数(k):通常10-15个。 组距(i):相邻两组段的最小值(下限)之差,一般用等距。 i=R /k,一般取整取偶数。 组段:界限分明,每个组段的起点称下限,终点称上限。最末一行应同时写出下限和上限。 列表划记:得到各组段的观察单位数。 直方图 频数分布表的用途 陈述资料 观察分布类型 发现可疑值 估计概率(样本较大时) 频数分布的两个特征: 频数分布的类型 对称分布 偏态分布 正偏态: 负偏态: 离散型数值变量资料频数分布 例:1998年某山区96名孕妇产前检查次数资料如下: 0,3,2,0,5,6,3……4,7。 第二节 集中趋势 集中趋势指标用于描述一组同质计量资料的集中趋势或反映一组观察值的平均水平。常用的平均数有算术均数、几何均数及中位数三种。 一、算术均数 算术均数简称平均数或均数:说明一组观察值的集中位置或平均水平。 X表示变量X的样本均数,?(希腊字母)表示总体均数。 均数适用于对称分布资料,正态或近似正态分布资料。 计算方法 直接法:当样本含量n较小时,可选用此法。设有n个观察值,分别为X1,X2 ……,Xn,均数的计算公式为: 例 1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.122.5,140.0。求平均数。 加权法:当样本含量n较大时,一般将观察值分组,列出频数表,再用加权法计算均数。其计算公式为: 某地100名12岁男孩身高均数的计算(加权法) 表1-1中第3列为组中值X,计算方法是将本组下限和下组下限相加除以2,如第一组X1=(122+126)/2=124,余此类推。第4列fX是频数f和组中值X的乘积。 二、几何均数 几何均数用G表示。适用于对数正态分布资料或等比资料,例如抗体的平均滴度和平均效价。 计算方法: 直接法:样本含量n较小时,选用此法。有n个观察值X1, X2,……Xn,几何均数的计算公式为: 上式计算时需作连乘,还要开n次方,比较麻烦,一般采用对数形式计算。 例.6份血清抗体滴度为: 1:2,1:4,1:8,1:8,1:16,1:32,求平均数。 加权法: 102名健康人的钩端螺旋体血清抗体平均滴度 三、中位数 将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数。用M表示。 中位数适用于任何一种分布的计量数据,一般多用于描述偏态分布或数据一端无界资料的集中趋势。 计算方法 直接法:样本含量n较小时,可根据下式计算: 某病患者5人潜伏期分别为2,4,6,7,20,求中位数。本例n=5,为奇数 频数表法:样本含量n较大时计算中位数可用频数表法。将观察资料归纳成频数表,计算累计频数,按下式计算。 107名正常人尿铅含量分布 百分位数 百分位数是一种位置指标,用PX表示。 百分位数是一个有序数列百等分的分割值。第50百分位数(P50)也就是中位数,中位数是一个特定的百分位数。 计算公式: 第三章 离散趋势 两组计量数据如下,分析其分布特征。 甲组:98,99,100,101,102 乙组:80,90,100,110,120 丙组:80,98,100,102,120 三组数据的均数都是100,说明集中趋势相同。但三组数据的分布特征不尽相同,5个数据间的参差不齐的程度不一样。甲组数据的变化范围较小,而乙、丙组数据的变化范围较大,乙、丙组数据间隔不同,即三组的离散度不同;离散度是一个非常重要的统计指标。 一、全距 亦称极差,用R表示,是一组观察值中最大值与最小值之差,反映个体差异的范围。全距大,说明变异度大;反之,说明变异度小。如例1-8中甲组全距为4,乙组全距为40,表明乙组变异度大。 但全距除了最大值和最小值之外,不能反映组内其它数据的变异度;易受个别数据的影响,稳定性较差,抽样误差较大,而且还受n大小的影响,平均起来,n越大,全距越大。 二、四分位间距 四分位间距是两个特定的百分位数之差,用Q表示 Q=QU-QL 适用于任何分布
文档评论(0)