网站大量收购独家精品文档,联系QQ:2885784924

02卢洁-定量资料的统计描述研.ppt

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02卢洁-定量资料的统计描述研

引 子: 频数( frequency ):指在一个抽样资料中,某变量值出现的次数。 ⒈ 求全距(Range,简记R ):是一组资料中 最大值(Xmax)与最小值(Xmin)之差,亦称极差。 2. 定组距:将全距分为若干段,称为组段。 组与组之间的距离,称为组距;用小写i 表示。 3.写组段:即将全距分为若干段的过程。 4. 列表划记:根据预定的组段和组距,用 划记的方法整理原始资料。 4. 样本含量足够大时,以频率作为概率的估计值。 (一) 算术平均数(arithmetic mean) ● 简称:均数(mean) ● 使用条件:单峰、对称分布(特别是正态分 布)的资料。 ● 样本均数用符号:X 表示 ● 总体均数用符号:μ表示 ● 计算方法有两种:直接法(小样本)和加权法(大样本) (二) 几何均数(geometric mean, G) ● 概念:对一组观察值,先进行对数变换,按算术均数计算方法求其对数值的均数,该均数的反对数值即几何均数(G)。 ● 使用条件:观察值变化范围跨越几个数量级的资料 ,其数据一般呈偏态分布,或为等比资料(倍数变化)对数正态分布资料。 ● 表示符号:G ● 计算方法:直接法和加权法 1.有8份血清的抗体效价分别为: 1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗体效价。 1.有8份血清的抗体效价分别为: 1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗体效价。 (三)中位数(Median,M) ● 概念:把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。 ● 使用条件:适用于任何分布的定量资料,特别是当一组资料类型分布不清或明显偏态分布时的平均数的计算。 ● 表示符号:M ● 计算方法:直接法和加权法  百分位数(Percentile,P) ● 概念:是一个数值,一种位置指标。表示位于全部观察值第X%位置处的数值。一个PX将总体或样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50百分位数即是中位数。 ● 表示符号:Px ● 计算方法: 频数表计算 P50 = M 1.某病患者9名,发病潜伏期分别为顺序 2、3、3、3、4、5、6、9、16d,求中位数。 离散程度大说明均数代表性差 离散程度小说明均数代表性好 (一) 极差(Range, 简称R) ●计算:R=最大值-最小值= Xmax - Xmin ●意义:反映样本变量值的全范围。 ●条件:对变量值的各种分布类型的资料 都适用。 ●优点:简单明了,容易理解,使用方便。 ●缺点:仅考虑了极大值和极小值,未考虑 其它变量的个体差异。 ●建议:与其他离散指标共同使用。 (二) 四分位数间距(Quartile, 简称Q) ●计算:Q=QU-QL=P75-P25 ●意义:中间一半观察值的极差。 ●条件:对变量值的各种分布类型的资料 都适用。 ●优点:类似R值但比其稳定。 ●缺点:未考虑全部观察值的变异度。 ●建议:与其他离散指标共同使用。 四分位数间距( Quartile 用Q表示) (三) 方差( Variance, 简称 ) 极差和四分位间距未考虑全部观察值的变异度 甲:26 28 30 32 34 证明: 离均差平方和的大小,除与变异度有关外,还与变量值的个数(多少)有关,为在变量值个数不等时进行比较,还要除以变量值的个数,所得值即为总体方差,用σ2表示: 公式中存在的问题? 根据以上公式研究的结果表明求得的样本方差总是偏小;为解决此问题,英国统计学家通过实验,用n-1代替可消除误差。 方差:分总体方差 ,样本方差S2 ●计算: ●意义:克服了R值的不足,考虑了每个变量值的离散情况并消除了N的影响。 ●优点:全面地考虑每个变量值的离散情况 ●缺点:其单位是原度量单位的平方。 (四)标准差(Standard deviation,SD或S) 方差的单位是原度量单位的平方,不便使用。 标准差的计算: (五 )变异系数:简称CV ●概念:是同一组资料的标准差与均数之比,又叫变异度或离散系数。 ●计算: ●实际含义:标准差相对于同组均数的百分比。 ●优点:CV 消除了度量衡单位,用于比较 1.单位不同的多组资料的变异度。 2.均数相差悬殊的多组资料的变异度。 小 结 ⒈为描述数值变量的分布特征,可将观察值编制 频数表,绘制频数分布图。 ⒉集中趋势

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档