第二篇 定量资料的统计描述02.ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 定量资料的统计描述 问题1: 何为定量资料? 问题2: 何为统计描述(statistical description)? 统计描述:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。 目的使资料简洁、明了,便于人们了解资料的规律性。 一、变量的频数分布 1、离散型定量变量的频数分布 例2-1 1998年某山区96名孕妇产前检查次数资料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,……,4,7。 频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。 频数分布表(frequency distribution table)简称频数表(frequency table):含有组段与频数的统计表,称频数表。 直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。 2、连续型定量变量的频数分布 问题: 1)何为连续型定量变量? 2)其与离散型定量变量有何区别? 3)连续型定量变量的频数分布表该如何绘制? 连续型定量变量频数表的编制方法: 1)计算全距(range , R) R=最大值 - 最小值=29.64-7.42=22.22 确定组段数(K)与组距 如等组距,则 组距 = R / K 3)确定组段、计数归表 问题: 频数直方图与频率密度直方图的意义是否一样? 变量频数分布的类型: 1)对称分布 2)偏态分布: 正偏峰(positive skew )分布(向左偏) 负偏峰 (negative skew) 分布(向右偏) 变量频数分布的两个特征 1)集中趋势(central tendency) 2)离散趋势 (tendency of dispersion) 二、 定量变量的特征数 (描述定量变量的统计指标、 或定量变量的数值特征) 1、描述集中趋势的统计指标(平均数 average) 1)算术均数(arithmetic mean),简称均数 2)几何均数(geometric mean, G) 3)中位数(median, M) 4)众数(mode) 5)调和均数(harmonic mean, H) 对于频数表资料,可用百分位数的方法计算中位数。 百分位数(percentile, Px): 对总体来说,它表示总体中数值小于的Px个体恰有x%。 对样本来说,它表示在按照升序排列的数列里,小于Px的个体数在整个样本中所占百分比为x%。 显然,中位数就是P50。 问题:算术平均数与中位数的区别与联系 1、都是用来表示总体的一般水平或分布的集中趋势,都属于抽象化的代表值。 2、代表的意义不同: 算术平均数是对所有变量值来计算的平均数,它能概括反映整个数列中每个变量值的平均水平; 中位数则是根据总体中处于中间位置上的少数变量值来确定的代表值。 从这一点来说,算术平均数对数据的概括能力比中位数显然来的更强一些。 3、与中位数相比,算术平均数对数据变化的“灵敏度”很高。但算术平均数极容易受到个别极端值的影响,即对极端值的“耐抗性”较低。“灵敏度”与“耐抗性”是一对矛盾,实际应用中,可根据这些特点和分析的要求,审慎的选择有关指标。(分布类型) 4、适用资料的类型:算术平均数和中位数均适用于定量资料,但中位数还适用于有序分类资料。 问题:考核甲、乙、丙三个中药店服务员的技术水平,令每人每次从盒中取10克某种中药,各取5次进行称量,结果如下(g): 甲:9.6 10.5 10.0 9.5 10.4 乙:9.9 10.1 9.9 10.2 9.9 丙:9.5 9.5 9.6 9.4 9.4 2、描述离散趋势(变异)的统计指标 1)极差(range, R) 2)四分位数间距(quartile range,QR) 3)方差(variance) 4)标准差(standard deviation) 5)变异系数(coefficient of variation ) 1)极差: R= 最大值 – 最小值 A: 26 28 30 32 34 B: 24 27 30 33 36 C: 26 29 30 31 34 极差: 计算方便; 只考虑两个极值; 与n有关,用于比较是需注意。 标准差与方差的含义类似, 值越大,说明变量的变异越大, 都适合用来表达对称分布的离散趋势。

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档