- 1、本文档共76页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第二章个体变异与变量分布;个体变异(individualvariation);幻灯片1;(一)定量资料的频数分布;1.频数分布表的制作步骤
(1)计算极差(R)
R=Xmax–Xmin=160.9-125.9=35(cm)
(2)确定组数、组距:
组数:8~12
组距:i=R/组数=35/10=3.5≈4(cm)
(4)确定组段:含下限,不含上限
第一组段下限≤Xmin
最后一组上限Xmax
(4)划记:计算频数、频率
2.分布图;;
;定性资料的整理:根据指标的自然属性归类,计数频数
等级资料的整理:根据指标的不同等级归类,计数频数;709对肺癌患者和非肺癌患者吸烟情况
;例:某医院探讨不同期次矽肺的胸部平片肺门密度变化,资料如下表,问矽肺患者肺门密度的增加与矽肺期次有无关系?;描述分布类型
描述分布的特征
便于发现特大、特小的可疑值
便于计算有关指标、统计分析与处理;(三)数据的分布类型;
;;;;;分布类型;集中位置的描述
离散趋势的描述
;是描述一组变量值的集中趋势或平均水平的统计指标。是一组变量值的集中水平的代表值。
种类:算术均数、几何均数、中位数、众数、加权均数等
注意:同质的变量值才能在一起求平均数!
;(一)算术均数(arithmeticmean)简称均数(mean)
1.适用条件:单峰对称分布、正态分布的资料
2.计算公式:
①小样本:
;②大样本:;;例:五人血清抗体滴度:
1:10,1:100,1:1000,1:10000,1:100000;1适用条件:各变量值成倍数或对数正态分布的资料
2公式:;例、有5份血清的抗体效价分别为
1:10,1:20,1:40,1:80,1:160,
求平均抗体效价?
;使用注意:
(1)变量值中不能有0;
(2)同一组变量值不能同时存在正,负值;
(3)若变量全为负值,计算时将负号除去,算完后再加上。;(三)中位数(median)及百分位数(percentile)
将一组变量值从小到大排列,居中的那个变量值。
1.适用条件:任何分布(偏态、分布不明、两端无界限)
2.计算公式:
小样本:;L:M所在组的下限
i:M所在组的组距
fm:M所在组的频数
:M所在组前一组累积频数;例2.16在某市测得239名正常人发汞,资料见表2.11,试计算其95%参考值范围。
表2.11某市239名正常人发汞值
;百分位数;;应用中位数和百分位数时注意事项:
①所有分布类型的资料均可计算中位数和百分位数;
②例数较少时,接近两端的百分位数不稳定,不宜用两端
的百分位数估计频数分布范围;
③中位数抗极端值的影响,比均数好,但不及均数精确;
当资料可计算均数或几何均数时,不宜计算中位数。;描述集中趋势的指标:平均数
种类适用条件计算公式
正态分布
对数正态
任何分布
;有甲、乙两组同性别同年龄儿童体重(公斤):
甲组26,28,30,32,34
乙组24,27,30,33,36;离散趋势的描述;1.全距(极差)
R=Xmax-Xmin反映资料的分布范围
R大→变异程度大,R小→变异程度小
优点:简单明了
缺点:不灵敏:只考虑了最大、最小值
抽样误差大,不稳定
;2.四分位数间距(Q)即P75与P25之差
P25:1/4的观察值小于它,称下四分位数P25~QL。
P75:1/4的观察值大于它,称上四分位数P75~QU。
Q=QU-QL,其间包含了中间的50%变量值,即
中间50%变量值的极差。;3.方差与标准差;
文档评论(0)