网站大量收购闲置独家精品文档,联系QQ:2885784924

定性的统计描述概览.ppt

  1. 1、本文档共132页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Scaling Factor:缩小倍数,填入数值后,坐标抽刻度为原刻度除以该数值所得。系统默认为1。 * * 4.直方图(histogram) 适合表示定量变量的频数(或频率)分布资料。 以直方面积描述各组频数的多少,面积的总和相当于各组频数之和。 直方图的横轴是定量变量,纵轴是频数。 注意如各组的组距不等时,要折合成等距后再绘图,即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。 另一种表示数值变量资料频数分布的方式是将各组段观察频数除以总观察频数得到各组段的频率,以各组段频率除以组距得到的频率密度作为直方图高度,绘制的直方图称为频率直方图,它以各直方面积表示各组频率,其面积的总和为1 或100% 。 例 1997年某地共报告乙型病毒性脑炎104例,其年龄分布如图7。 图7 1997年某地乙型病毒性脑膜炎病例的年龄分布 5.统计地图(statistical map) 统计地图是用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。 例 2003年广东省发生了某急性传染病的流行,下图描述了该急性传染病发病数在广东省的分布情况。 图8 2003年广东省某急性传染病发病数的地理分布 图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区 6.其他特殊分析图 在探索性数据分析中,一些特殊的统计图对于发现数据分布特征有着重要的意义。这里介绍常用的箱式图、茎叶图。 箱式图(box plot) 使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。 箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除异常值外的最小值和最大值。另外标记可能的异常值。 显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。 四分位数间距IQR P75 P25 P50 本体最大值 本体最小值 离群值 (P75+1.5IQR) 极值(P75+3IQR) 体重(kg) 病人年龄 例 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图9。 图9中显示粉尘数的分布呈偏态分布. 净化厂粉尘数较少,非净化厂粉尘数较多。 图9 某地不同类型化妆品厂车间粉尘数分布箱式图 茎叶图(stem-leaf plot) 将数据分离成两部分:整数部分和尾数部分,整数部分形成图的茎,尾数部分形成图的叶。 茎叶图的排列方式与频数表有些相似,每行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图显示每个叶的尾数数值,同样在图的下方标示每个叶代表几个实际观察值。茎叶图可以非常直观地显示数据的分布范围和形态,近年非常流行。 例 绘制茎叶图10。图中茎的宽度为1,即观察值的整数位。每个叶代表1个观察值,显示的尾数即观察值的第一位小数。从图可以看出血清总胆固醇的分布范围从2.3到5.7,基本近似正态分布。而且可以查看每个观察值的取值情况。 Stem:实际观察值除以茎宽后的整数部分。 Leaf:实际观察值除以茎宽后的小数部分。 :残叶 Stem:实际观察值除以茎宽后的整数部分。 Leaf:实际观察值除以茎宽后的小数部分。 :残叶 Extremes:极端值,计算方式同箱图 常用统计图适用资料及实施方法 图形 适用资料 实施方法 条图 组间数量对比 直条高度表示数量大小 直方图 定量资料的频数分布 直条的面积表示各组段的频率 百分条图 频率分布 直条分段的长度表示各部分的频率 饼图 频率分布 圆饼的扇形面积(或其张角)表示各部分的频率 线图 定量资料变动的增量 采用横坐标和纵坐标均为算术尺度的坐标系 半对数线图 定量资料变动的倍数 采用横坐标为算术尺度、纵坐标为对数尺度的坐标系 箱式图 定量资料的分布 用箱体、线条标志四分位数间距及中位数、全距 茎叶图 定量资料的分布 用茎表示组段的设置 ,叶片为个体值,叶长为频数 案例分析 案例2-2 某人编制了一张统计表,你认为哪些需要改进? 疾病 年龄组 0~ 15~ 35~ 55~ 75~ 胃癌 无 1.13/10万 19.92/10万 150/10万 313.44/10万 食管癌 无 0.1/10万 2.18/10万 35.20/10万 73.56/10万 肝癌 0.34/10万 1.64/10万 25.30/10万 97.51/10万 134.33/10万 肺癌 无 0.41/10万 20.21/10万 125.10/10万 137.

文档评论(0)

yy558933 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档