- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2.3离散程度的描述【例2.9】三组同性别、同年龄儿童的体重(kg)如下,试分析其集中趋势和离散程度。甲组2628303234乙组2427303336丙组2629303134添加标题三组的的均数相同,但显然5个数据间参差不齐的程度是不一样的。二者结合,才能全面认识事物。添加标题描述离散程度的指标有极差、四分位数间距、方差、标准差及变异系数单击此处可添加副标题2.3.1.极差极差(range,记为R)亦称全距。即一组数据中最大值与最小值之差。反映个体的变化范围。极差大,说明变异度大;反之,说明变异度小优点:计算简单,意义明确。缺点:除了最大值和最小值外,不能反映组内其它数据的变异程度;样本例数悬殊时不宜比较极差;抽样误差较大,极不稳定。单击此处添加大标题内容2.3.2四分位数间距四分位数(quartile,记为Q),是特定的百分位数,即P25(下四分位数)和P75(上四分位数)四分位数间距(inter-quartilerange)就是上四分位数与下四分位数之差Q=QU-QL四分位数间距可看成中间一半观察值的极差用四分位数间距反映变异程度的大小优点:比极差稳定,缺点:但仍未考虑全部观察值的变异程度。适用场合:如集中趋势用中位数描述,则相应的离散趋势用四分位数间距描述。2.3.3方差与标准差离均差:总体中每个变量值X与总体均数μ之差,X-μ,称为离均差离均差平方和:将离均差平方后再相加,得Σ(X-μ)2,称为离均差平方和(sumofsquares),其除了与变异度有关,还与变量值的个数N有关。总体方差:方差的度量单位是原变量值度量单位的平方总体标准差:方差标准差越大说明个体的变异度越大;反之,说明个体的变异度就越小实际计算时用公式:样本标准差s:*2统计资料的整理与描述原始资料杂乱无章【例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。分类资料的整理列出类别,计算频数,列表2.1频数表资料整理的必要性条理化,系统化,显示数量特征、分布规律,便于进一步统计分析数值变量资料的整理2.1.1.频数表的编制【例2.1】2011年某市120名7岁男童身高(cm)资料如下,试编制频数表。频数表的编制方法如下:找出观察值中的最大值和最小值,并求出极差决定组段数、组段和组距确定组段数要以充分反映数据的分布特征为原则组距=26.6/10=2.66可以参考斯特奇斯(Sturges)提出的经验公式来确定分组数列表划记:计算各组段包含的观察单位个数第一章节2.1.2频数分布的图示图2.12011年某地120名7岁男童身高的频数分布2.1.3.频数分布的分析对频数表的分析,主要在于以下几个方面:有无可疑值通过对频数分布的分析,发现某些特大或特小的离群值、可疑值分布的类型频数分布可分为对称分布和偏态分布两种类型.不同类型的分布,应采用不同的统计分析方法对称分布对称分布,是指观察值向中央部分集中,以中等数据居多,左右两侧分布大体对称。如:正常人身高、体重,脉搏,血红蛋白等的分布所谓偏态分布,是指观察值偏离中央尾部偏向数轴正侧(或右侧),称正偏态(或右偏态);如:食物中毒引起腹泻的潜伏期尾部偏向数轴负侧(或左侧),称负偏态(或左偏态)如:慢性病患者年龄的分布左偏态右偏态分布特征分布的两个重要特征:集中趋势和离散趋势总体中的个体总是具有同质性,这些同质性使得观察值应趋向同一数值(即集中趋势)。同一总体中的个体之间又普遍存在着各种差别,使得个体观察值不会完全相同。2.2集中趋势的描述平均数反映一组观察值的集中趋势、中心位置或平均水平它是该组数据的代表,能对一群同类事物或现象的数量特征作出概括的说明,是统计学中应用最广泛、最重要的一个指标体系。常用的平均数有(算术)均数,几何均数和中位数1)未分组资料(原始资料)的均数的计算方法:将所有的观察值直接相加,再除以总观察数n2.2.1均数均数是算术均数的简称,习惯上用希腊字母表示总体均数;用表示样本均数。均数反映一组观察值在数量上的平均水平,最适合单峰对称分布资料的平均水平的描述。【例2.3】求表2.1中资料的均数2.2.2几何均数有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等
文档评论(0)