SAS讲义第24课总体均值的估计.docVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS讲义第24课总体均值的估计

 FILENAME 3236324-590117e5e01a3.doc SAS系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Page  PAGE 22 of  NUMPAGES 22 总体均值的估计 对于样本来自正态总体和方差齐性的基本假设,根据观察结果(结果变量或反映变量)的水平数,一元时基本的分析方法有检验、检验,多元时用多元检验(或Wilks’∧检验)。 计量资料的统计指标 测定每个观察单位某项指标值的大小,所得的资料称为计量资料(measurement data)又称测量资料,这类资料一般具有计量单位。计量资料的统计指标分成两大类: 表达计量资料集中位置的指标,用以描述观察值的平均水平,如算术均值、几何均值、调和均值、中位数、众数、百分位数。 表达计量资料变异的指标,又称离散指标,用以描述观察值间参差别不齐的程度,即离散度或称变异度,如全距、标准差、方差、标准误差、变异系数、四分位数间距等。 设原始观察值为,第组频数记为,组中值记为。在不发生混淆的场合,有时将下标省略,如,有时简记为。 集中位置的指标 算术平均值 算术平均值(arithmetic mean)简称为均值(mean),总体均值用希腊字母表示,样本均值用表示。算术平均值的具体计算方法分为简单算术平均和加权算术平均两种。简单算术平均为: (24.1)加权算术平均为: (24.2)算术平均值有两个重要的数学性质: = 1 \* GB3 ①各个变量值与平均值离差之和等于零, = 2 \* GB3 ②各个变量值与平均值的离差平方之和为最小值。 几何均值 几何均值(geometric mean)用表示,为观察值的总乘积开次方根。根据资料是否分组,也分为简单几何平均和加权几何平均两种方法。简单几何平均为: (24.3)为避免溢出及方便计算,常用对数计算,也称对数平均值,两边取对数有: (24.4)加权几何平均为: (24.5)几何均值适用于表达呈对数正态分布资料的平均水平。也常用于速度、比率等变量的平均。 调和均值 调和均值(harmonic mean )用表示,为观察值的倒数求平均,然后再取倒数而得到的平均值,也称倒数平均值。调和平均值有简单调和平均值与加权调和平均值两种。简单调和平均值为: (24.5)加权调和平均值为: (24.6)调和均值适用于表达呈极严重的正偏态分布资料的平均水平。 中位数 中位数(median)用表示,它将总体或样本的全部观察值分成两部分,每部分各有50%个观察值,其计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值为奇数时,处于中间的那个数为中位数。偶数时处于中间的两个数的均值为中位数。 中位数是位置平均值,它不受极端值的影响,在具有个别极大或极小值的分布数列中,中位数比算术平均值更具有代表性。 众数 频数最大的变量值称为众数(mode),列为频数表的资料,频数最大的组的组中值为众数。适用于粗略地表示呈单峰分布资料的集中趋势。当数据个数较少时,众数就是出现次数最多的个数据。 百分位数 百分位数(percentile)以表示,它将总体或样本的全部观察值分成两个部分,其中有个观察值小于,(100-)%个观察值大于。如百分之25分位数或称第25百分位数,表示有25%个观察值小于;75%个观察值大于。中位数就是百分之50分位数。 离散程度的指标 全距 全距(range)也称极差是一种离散指标,是最大与最小观察值之差。用极差反映总体分布的离散程度虽然简便,但它只从两端数值考察,忽略了中间数据的变动情况,不能说明整体的差异程度,尤其是存在极端值情况下,使用极差往往会造成错误的结论。 标准差与方差 标准差(standard deviation)与方差(variance)是一种常用的离散指标,结合均值能给出正态分布的特征。标准差的平方为方差,标准差(或方差)越大,表示观察值的分布越分散;反之,标准差(或方差)越小,表示观察值的分布越集中。如果标准差为0,表示这组观察值都为一个相同的值。实际应用时常以均值±标准差的写法综合观察值的集中和离散特征。 总体的标准差和方差分别以和表示,样本的标准差和方差分别以和表示,当用样本标准差作为的估计值时,有: (24.7)其中为样本含量,称为离均差平方和,也可以如下计算: (24.8)如用频数表资料,有: (24.8)变异系数 变异系数(coefficient of variantio

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档