数值变量统计描述10.9.19.ppt

  1. 1、本文档共94页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数值变量统计描述10.9.19

? 离散型资料(discrete data):是指变量取值可以一一列举的资料。例如,每个育龄妇女现有的子女数。 如1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。 ? 连续型资料(continuity data):是指变量取值不能一一列举(即变量取值为一定范围内的任意值)的资料。例如,人体的身高(cm)、体重(kg) 等。 (1)求极差(range):即最大值与最小值之差,又称为全距。R=84 – 57 =27(次/分) (2) 决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一, 再略加调整。 27/10=2.7 ≈3 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56- 59- …… 80- 83-85 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。 ? 频数分布图 (1)对称分布 :若各组段的频数以中 心位置左右两侧大体对称,就认为该资料是对称分布 (2)偏态分布 : 1)正偏态分布:右侧的组段数多于左侧的组段数,频数向右侧拖尾。 2)负偏态分布:左侧的组段数多于右侧的组段数,频数向左侧拖尾。 表2-3数据的频数分布特征: ①数据变异(离散)的范围在57~84 (次/分 ) ②数据集中(平均)的组段在68~73 (次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。 公式 : 意义:一组性质相同的观察值在数量上的平均水平。 表示 ?(总体) X(样本) 计算:直接法、间接法、计算机 特征: ∑(X- X)=0 估计误差之和为0。 应用:正态分布或近似正态分布 注意:合理分组,才能求均数,否则没有意义。 例 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。 例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。 适用于成等比数列的资料,特别是服从对数正态分布资料。 例题:11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60 平均存活天数? 例: 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。 设有n个原始数据从小到大排列,第X 百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时: 例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 患 者: 住院天数: (1)n=120,为整数: 例 试分别求频数表的第25、第75百分位数。 众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。 例2-7 有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。 正态分布时: 均数=中位数=众数 正偏态分布时: 均数 中位数 众数 负偏态分布时: 均数 中位数 众数 变异(variation)指标 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 总体方差 样本方差 标准差的公式还可以写成 : 利用频数表计算标准差的公式为 标准差的意义和用途 某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg, 比较其变异度? 正态分布的通俗概念: 如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。 以某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态分布。 频数分布表:

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档