- 1、本文档共70页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第08单元-数值变量资料的统计描述
回顾: 根据是否定量划分,资料被分作不同的类型: 数值资料(measurement data): 用定量的方法对观察单位进行测量得到的资料,亦称作计量资料。 分类变量资料(enumeration data): 用定性的方法得到的资料,亦称计数资料。 等级资料(ranked data): 不能精确测量,仅能根据相对大小分为几个等级。 第一节 数值变量资料频数分布 数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。 一、频数分布表及其制作 频数表的编制步骤: 二、频数分布图 三、频数表和频数分布图用途 1.描述频数分布的类型(对称分布、偏态分布) 2.描述频数分布的特征 3.便于发现一些特大或特小的可疑值 4.便于进一步做统计分析和处理(加权) (1)对称分布 : 若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布 (2)偏态分布 : 1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。 2)左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。 2.描述频数分布的特征 图8-1(P154)数据的频数分布特征: ①数据变异(离散)的范围在3.60~5.60(mol/L ) ②数据集中(平均)的组段在4.20~5.00(mol/L )之间,尤以组段的人数4.60~4.80 (mol/L )最多。且上下组段的频数分布基本对称。 3.便于发现一些特大或特小的可疑值 第二节 集中趋势指标 统计上使用平均数(average)这一指标体系来描述一组变量值的集中趋势或平均水平。 常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median) 百分位数(percentile) 一、算术均数 算术均数:简称均数(mean) 定义:是一组变量值之和除以变量值个数所得的商。均数适用于资料呈正态分布(或近似正态或对称分布)资料。 总体均数:μ 样本均数: x 1、计算方法 (1)直接计算法 (2)加权法(利用频数表) 公式 : 二、 几何均数(geometric mean) 定义:用G表示,是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。 其适用条件是: ①当一组观察值为非对称分布且其差距较大时,用 均数表示其平均水平会受少数特大或特小值影响; ②数值按大小顺序排列后,各观察值呈倍数关系或近 似倍数关系。 例8.3 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64,1:128,求平均抗体效价。 (2)加权法(当观察例数多时采用) 公式: 例8.4 有60人的血清抗体效价,分别为:7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,求平均抗体效价。 三、??中位数与百分位数 (一)中位数(median) 定义:用符号M表示,中位数是把一组观察值,按大小顺序排列,位置居中的数值(n为奇数)或位置居中的两个数值的均值(n为偶数)。 其适用情况有: ①当资料呈明显的偏态分布; ②资料一端或两端无确定数值(如大于或小于某数值); ③资料的分布情况不清楚。 计算公式: 例8.5 7名正常人的血压(舒张压) 测定值(mmHg)为:72,75,76,77,81,82 ,86,求中位数。 例8.1频数表中位数的计算 例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。 ,为整数: 带有小数 2.频数表法 公式: 当 时,公式(8.5)即为中位数的计算公式: 例8.1 试分别求例8.1频数表的第25、第75百分位数。 三种平均数的特点 算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。?正态分布 几何均数一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。 中位数不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。?偏态分布 第三节 离散趋势的描述 反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个个体
您可能关注的文档
最近下载
- 电容式液位传感器及测量原理.doc
- 译林版小学一年级英语上册全套教案.pdf VIP
- 2023-2024年广东省广州市海珠区六年级上册期末数学试卷及答案(人教版).pdf
- [GB5009标准]GB 5009.156-2016 食品安全国家标准 食品接触材料及制品迁移试验预处理方法通则.pdf
- JTG-T 3650-2020公路桥涵施工技术规范.doc
- 县统计局党支部工作总结.pptx VIP
- 县人大常委会办公室的资料搜集提纲.doc VIP
- 某大型家电集团微波电器事业部通用分权规范手册.xls VIP
- 超声引导下针刀治疗.pptx VIP
- 2024年湖南司法警官职业学院单招职业技能测试题库及答案解析.docx VIP
文档评论(0)