SAS系统和数据分析总体均值的估计参考.doc

SAS系统和数据分析总体均值的估计参考.doc

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS系统和数据分析总体均值的估计参考

总体均值的估计 对于样本来自正态总体和方差齐性的基本假设,根据观察结果(结果变量或反映变量)的水平数,一元时基本的分析方法有检验、检验,多元时用多元检验(或Wilks’∧检验)。 计量资料的统计指标 测定每个观察单位某项指标值的大小,所得的资料称为计量资料(measurement data)又称测量资料,这类资料一般具有计量单位。计量资料的统计指标分成两大类: 表达计量资料集中位置的指标,用以描述观察值的平均水平,如算术均值、几何均值、调和均值、中位数、众数、百分位数。 表达计量资料变异的指标,又称离散指标,用以描述观察值间参差不齐的程度,即离散度或称变异度,如全距、标准差、方差、标准误差、变异系数、四分位数间距等。 设原始观察值为,第组频数记为,组中值记为。在不发生混淆的场合,有时将下标省略,如,有时简记为。 集中位置的指标 算术平均值 算术平均值(arithmetic mean)简称为均值(mean),总体均值用希腊字母表示,样本均值用表示。算术平均值的具体计算方法分为简单算术平均和加权算术平均两种。简单算术平均为: (24.1) 加权算术平均为: (24.2) 算术平均值有两个重要的数学性质:①各个变量值与平均值离差之和等于零,②各个变量值与平均值的离差平方之和为最小值。 几何均值 几何均值(geometric mean)用表示,为观察值的总乘积开次方根。根据资料是否分组,也分为简单几何平均和加权几何平均两种方法。简单几何平均为: (24.3) 为避免溢出及方便计算,常用对数计算,也称对数平均值,两边取对数有: (24.4) 加权几何平均 (24.5) 几何均值适用于表达呈对数正态分布资料的平均水平。也常用于速度、比率等变量的平均。 调和均值 调和均值(harmonic mean )用表示,为观察值的倒数求平均,然后再取倒数而得到的平均值,也称倒数平均值。调和平均值有简单调和平均值与加权调和平均值两种。简单调和平均值为: (24.5) 加权调和平均值为: (24.6) 调和均值适用于表达呈极严重的正偏态分布资料的平均水平。 中位数 中位数(median)用表示,它将总体或样本的全部观察值分成两部分,每部分各有50%的观察值,其计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值为奇数时,处于中间的那个数为中位数。偶数时处于中间的两个数的均值为中位数。 中位数是位置平均值,它不受极端值的影响,在具有个别极大或极小值的分布数列中,中位数比算术平均值更具有代表性。 众数 频数最大的变量值称为众数(mode),列为频数表的资料,频数最大的组的组中值为众数。适用于粗略地表示呈单峰分布资料的集中趋势。当数据个数较少时,众数就是出现次数最多的个数据。 百分位数 百分位数(percentile)以表示,它将总体或样本的全部观察值分成两个部分,其中有的观察值小于,(100-)%个观察值大于。如百分之25分位数或称第25百分位数,表示有25%个观察值小于;75%个观察值大于。中位数就是百分之50分位数。 离散程度的指标 全距 全距(range)也称极差是一种离散指标,是最大与最小观察值之差。用极差反映总体分布的离散程度虽然简便,但它只从两端数值考察,忽略了中间数据的变动情况,不能说明整体的差异程度,尤其是存在极端值情况下,使用极差往往会造成错误的结论。 标准差与方差 标准差(standard deviation)与方差(variance)是一种常用的离散指标,结合均值能给出正态分布的特征。标准差的平方为方差,标准差(或方差)越大,表示观察值的分布越分散;反之,标准差(或方差)越小,表示观察值的分布越集中。如果标准差为0,表示这组观察值都为一个相同的值。实际应用时常以均值±标准差的写法综合观察值的集中和离散特征。 总体的标准差和方差分别以和表示,样本的标准差和方差分别以和表示,当用样本标准差作为的估计值时,有: (24.7) 其中,为样本含量,称为离均差平方和,也可以如下计算: (24.8) 如用频数表资料,有: (24.8) 变异系数 变异系数(coefficient of variantion)是一种离散指标,简记为,它是标准差与均值之比,用百分数表示: (24.9) 由于无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。 标准误差 标准误差(standard error)是统计量的标准差。因为统计量是样本观察值的函数,一旦样本改变,统计量的取值也会随之改变。为了避免与样本观察值的标准差相混淆,在统计学上,把反映一群性质相同的统计量离散程度大小的量称为标准误差。从理论上来说,只要给出了一个

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档