第5章描述性统计.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章描述性统计

第5章 描述性统计 采集到大量的样本数据以后,常常需要用一些统计量来描述数据的集中程度和离散程度,并通过这些指标来对数据的总体特征进行归纳。 描述样本数据集中趋势的统计量有算术平均值、中位数、众数、几何均值、调和均值和截尾均值等。 描述样本数据离中趋势的统计量包括极差、平均值、平均绝对差、方差和标准差等,此外还有峰度、偏差、分位数和相关系数等统计量,也能描述样本数据的某些特征。 描述集中趋势的统计量 5.1.1 几何均值 样本数据的几何均值m可以根据下式求得 Matlab中利用geomean函数计算样本的几何均值,其语法格式如下: m = geomean(X) 函数计算样本的几何均值。若X是矢量,则geomean(X)返回值为数据X中元素的几何均值。若X为矩阵,则geomean(X)返回值为一个行矢量,包含每列数据的几何均值。若X为N维数组,geomean函数沿X的第一个非单一元素维度进行计算。 m = geomean(X,dim) 计算X的第dim维的几何均值。 【例 5-1】 样本均值大于或等于样本的几何均值。 x = exprnd(1,10,6); geometric = geomean(x) geometric = 0.7466 0.6061 0.6038 0.2569 0.7539 0.3478 average = mean(x) average = 1583 0.9741 0.5319 1.0088 0.8122 5.1.2 调和均值 样本数据的调和平均值m定义为 Matlab中利用harmmean函数计算样本数据的调和平均值,其语法格式如下: m = harrmmean 计算样本的调和平均值。若X为矢量,则harmmean(X)函数返回值为X中元素的调和平均值。若X为矩阵,则harmmean(X)函数返回值为包含每列元素调和平均值的行矢量。若X为N维数组,harmmean函数沿X第一个非单一元素维度进行计算。 m = harmmean (X,dim) 计算X的第dim维的几何均值。 【例 5-2】 样本均值大于或等于样本的调和平均值。 x = exprnd(1,10,6); harmonic = harmmean(x) harmonic = 0.3382 0.3200 0.3710 0.0540 0.4936 0.0907 average = mean(x) average = 1583 0.9741 0.5319 1.0088 0.8122 5.1.3 算术平均值 样本数据的算术平均值可用下式定义 Matlab中利用mean函数计算矢量和矩阵中元素的均值,其语法格式如下: m = mean(X),若X为矢量,mean(X)返回值为X中元素的均值;若X为矩阵,mean(X)返回值为包含X中每列元素均值的行矢量; m = mean(X,dim) 计算X的第dim维元素的均值。 【例 5-3】 下面的命令行生成5个包含100个服从正态分布的随机数的样本,然后计算每个样本的算术平均值。 x = normmd(0,1,100,5); xbar = mean(x) xbar = 0.0264 0.0351 00424 0.0752 5.1.4 中值 median函数计算矢量和矩阵中元素的中值,其函数的调用格式为: m = median(X) 计算样本数据的中值。中值是样本数据中心趋势的稳健估计,因为异常值的影响较小。对于矢量,median(X)为矢量X中元素的中值。对于矩阵,median(X)为包含每一列中元素中值的行矢量。计算中值需要首先进行排序,因此计算大型矩阵的中值矢量时比较费时。 【例 5-4】 xodd = 1:5; modd = median(xodd) modd = 3 meven = median(xeven) meven = 2.5000 下列演示中值对于异常值的稳健性。 xoutlier = [x,10000]; moutlier = median(xoutlier) moutlier = 3 截尾均值 对样本数据进行排序以后,去掉两端的部分极值,然后对剩下的数据求算术平均值,得到截尾均值。 Matlab利用trimmean函数计算截尾均值,其语法格式如下: m = trimmean(X,percent) 若X为矢量,则m为X中元素的截尾均值,即剔除测量值中最大和最小的k个数据以后,计算样本X的均值,k=n*(percent/100/2),n为X的维数;若X为矩阵,则m为行矢量,其元素为X中各列元素的截尾均值;若X为多维数组,则m沿X中的第一个非单一元素维度进行计算。Percent为0和100之间的数。 m = trimmean

文档评论(0)

haocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档