- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 3 章 平均数、标准差与变异系数 数据有两种变化趋势:集中趋势和离散趋势。 表示数据集中趋势的指标有多个,如平均数(算术平均数、几何平均数)、中位数、众数,使用最多的是算术平均数。 表示数据离散趋势的指标有多个,如极差、平均离差、方差与标准差,使用最多的是方差与标准差。 资料中各观察值的总和除以观察值的个数所得的商,称为算术平均数,简称为平均数或均数。用符号 表示。 平均数的意义: 平均数用来描述资料的集中性,即指出资料中数据集中较多的中心位置,常用于同类性质资料间的相互比较。 计算方法 1. 直接法 适用于样本含量较小的非频数资料 如果一个含量为n的样本,其n个观察值分别用x1、x2……xn表示,则它们的平均数为 其中,?(Sigma)为总和符号, 表示从第一个观察值x1累加到第n个观察值xn,若在意义上已明确时,简记为?x。 2. 加权法 如果样本中有n1个x1,有n2个x2,那么,n1+n2个数的平均数是加权平均数。 同理: 各组的次数 fi 是权衡各组中值 xi在资料中所占比重大小的数量,因此f被称为是x的“权”,加权法也由此而得名。 在计算离散型频数资料的平均数时, 式中x为组值,f为频数,N为总频数(∑f),k为组数。 在计算连续型频数资料的平均数时, 式中m为组中值,f、N和k同上式。 平均数有以下几个基本特性: (1)平均数的计算与样本内每个值都有关,它的大小受每个值的影响。 (2)若每个xi都乘以相同的数k,则平均数亦应乘以k。 (3)若每个xi都加上(或减去)相同的数A,则平均数亦应加上(或减去) A。 中位数(median) 将资料中所有观察值从小到大依次排列,处于中间位置的数。以Md表示。 适用条件 资料呈偏态分布或频数分布类型不明,以及一端或两端无确定数值,这种资料用中位数作为代表值比用算术平均数为好。 非频数资料,先将各观察值由小到大排列,当n为奇数时,第(n+1)/2位置的观察值即为中位数,即: Md =x (n+1)/2 众数(Mode) 资料中出现次数最多的那个数或频数最多一组的组中值,记为Mo。 几何平均数(Geometric mean) 定义 指n个观察值乘积的n次方根。即 适用条件 主要应用于数据呈倍数关系或不对称分布的资料,算术平均数对这类资料的代表性差。如抗体效价(1:10,1:100,1:1000,1:10000)、增长率或生长率、动态发展速度等。 例 海虾养殖试验,各旬的生长速度3.0,1.5 1.3,1.2,1.2,1.1,1.1,求海虾的旬平均生长速度。 解: 即海虾平均生长速度为1.38。 其算术平均数为 当资料编成频数分布表时, —各组组中值; —各组次数; 二、离散趋势 资料的另一方面的特征是变异程度。如: A 组资料: 3 、 4 、 5 、 6 、 7 平均数为: 5 B 组资料: 1 、 3 、 5 、 7 、 9 平均数为: 5 这里的平均数 5 对于 A 组资料的代表性好?还是对于 B 组资料的代 表性好? 可见,只表明了数据的集中程度是远远不够的,还需要进一步说明数据的变异程度。只有通过变异程度的描述,才知道代表值的代表性。表示数据变异特征的数值叫变异数。常用的变异数有:极差、平均离差、方 差、标准差、变异系数等。 极差(全距) 极差 = 最大值 - 最小值 只利用了资料中最大值和最小值,不能准确表达资料中各个观察值的变异程度。 平均离差 首先求出离均差,即每个数与它们的平均数之间的离差;然后将所有的离均差平方,再相加,得出离均差平方和;最后用n-1除离均差平方和(按照统计学理论,不要用样本含量n去除),所得的商称为样本方差,用符号s2表示。 方差s2是离均差平方的平均数。虽然方差在实际应用中用得最广泛,但因它的单位是原始数据单位的平方,所以它不能直接地指出某个数x与平均数之间的偏离究竟达到什么程度。为此,采用标准差s做标准,衡量x与平均数之间的离散程度。 自由度 (degree of freedom) :统计学借此来反映一批变量的约束条件。 例如一个有 5 个观察值的样本,因为受到统计数的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足这一限制条件。 自由度记作 DF , 一般样本自由度等于观察值个数 ( n ) 减去约束条件的个数 ( k ) ,即 DF = n - k 。 为了方便计算,将离均差平方和转化为另一种形式,同时略去下标,上式可表示为: 在计算离散型频数资料的标准差时, 式中x为组值,f为频数,N为总频数
文档评论(0)