网站大量收购独家精品文档,联系QQ:2885784924

第八章数值变量资料的统计描述(一).docVIP

第八章数值变量资料的统计描述(一).doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数值变量资料的统计描述 课 时:6学时,其中理论4学时 实习2学时 授课对象:临床医学本科 目的要求:1. 掌握数值变量资料主要描述性指标的定义、应用条件和计算方法。 2. 熟悉标准差的应用、正态分布的特征、牢记正态曲线下面积的分布规律。 3. 了解制定医学参考值范围的步骤和方法。 重 点:主要描述性指标的定义、计算和应用,标准差的意义及应用。 难 点:正态分布特征及面积分布规律的应用。 教学方式:讲授、讨论 学时安排:组织教学2×2分钟,复习旧课3×2分钟,讲授新课75×2分钟,讨论答疑15分钟、小结5分钟, 实习90分钟。 理论教学内容如下: 对数值变量资料进行统计描述,需要根据资料的分布类型选择合适的统计指标,因此,首先我们要通过频数分布表或分布图来了解资料的分布特征。 第一节 数值变量资料的频数分布 频数分布表及其制作 什么叫频数(frequency)? 频数是指在对一组研究对象进行观察时,某变量或指标数值出现的次数。我们可以将各变量值及其出现的频数编制频数分布表,以此反应各变量值与其频数之间的关系,并观察资料的分布类型。 现利用例8.1 的资料来说明编制频数分布表的步骤。 1.求全距(极差):= 最大值—最小值=5.59—3.60=1.99(mmol/L) 2.确定组数、组段和组距 根据样本含量多少确定组段数,一般设8~13个组段,100例以上取10个左右,例数较少可相应减少组段数。 相邻两组段下限之差称为组距(),一般都用等距,且用“极差∕组段数”之商最接近的整数值作为组距,本例若分为10个组段,则=/=1.99/10=0.199(mmol/L), 取整0.2,便于汇总和计算。各组段的的起点和终点分别称为下限和上限。注意的是:第一组段应包括最小值,下限取3.60mmol/L,最末组段应包括最大值,略大于或等于最大值。即取5.60mmol/L。 3.列出频数表 组段确定后,将原始数据用划计法或计算机做出频数分布表,可得到各组段的频数、频率和累积频率,见表8-1。 二、频数分布的特征 由频数表可看出分布的两个重要特征,①集中趋势,空腹血糖测定值虽然高低不等,但向中间集中,中等水平(4.60~4.80 mmol/L)的人数最多;②离散趋势,即随着血糖值逐渐变大或变小,人数越来越少,向两端分散。由此知道资料的分布类型,频数分布有对称分布和偏态分布之分。对称分布是指集中位置在正中,左右两侧频数分布大致对称,这种分布统计学上称为正态分布或近似正态分布。如表8—1所示,若绘制成直方图更为直观清楚。偏态分布是指频数分布不对称,集中位置偏向一侧,若偏向数值小的一侧——正偏态,如食物中毒潜伏期的分布集中位置偏向数值大的一侧——负偏态分布,如冠心病,大多恶性肿瘤患者的年龄分布都呈负偏态分布。不同的分布选用不同的统计分析方法。 第一节 集中趋势指标 统计分析包括统计描述和统计推断两部分,统计描述是用统计指标、统计表和统计图来描述资料分布规律及数量特征;统计推断则包括总体参数估计和假设检验两个内容。 平均数(average)是一类描述数值变量资料集中趋势的指标。这类指标不但能给人一个简明概括的印象,而且还便于进行事物间的分析比较。医学统计上常用的集中趋势指标有、G、M,它们用于描述一组同质数值变量资料的平均水平或集中趋势。 一、算术均数 简称均数,它是一组已知性质相同的数值之和除以数值个数所得的商。常用表示样本均数,表示总体均数,适用于呈对称分布,尤其是正态分布或进似正态分布的数值变量数据资料。其计算方法有直接法,加权法、简捷法三种,随着计算机的普及,简捷法将被逐渐淘汰。 (一)直接法 当观察例数不多,如小于30时,或观察例数虽然很多,但有计算机及统计软件,宜选择此法, 公式: (8.1) 例8.2 测定5名健康人第一小时末血沉,分别是6,3,2,9,10mm,试求均数。 将5人血沉值代入公式8-1,得 (二)加权法 当观察值个数较多时,可先将各观察值分组归纳成频数表,用加权法求其均数。将数据编制成频数表,得出每组的频数,计算各组的组中值, 。 公式: (8.2) 式中,…分别为各组段的频数, ,……分别为各组段的组中值。 式中频数(又称作权数)与组中值之乘积,近似等于该组变量值之和;各组中值与权数之乘积的总和,视为所有变量值的总和;总和除以总频数的商,作为全部观察值的均数。由此可见,各组的权数越大,权数与组中值乘积越大,作用也越大;反之权数越小,作用也小,这就是该法被称为加权法的由来。 某地2002年

文档评论(0)

tt7090 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档