第3节 数据分布特征的描述.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例:某笔投资的年利率是按复利计算的。25年的年利率分配是:1年为3%,4年为4%,8年为8%,10年为10%,2年为15%。求平均年利率? 解: 问:如果是按单利计算呢? 例:某地区某年农民年收入的分布数列: 解:众数所在组是700~800,代入公式: 讨论:1)众数组的次数与相邻组的次数相等,则Mo=? 2)众数组下限前一组次数小于上限,则Mo偏向上限还是下限?相反又如何? 2)中位数的位置为3000/2=1500,240+480+1050正好大于1500,中位数所在组是第三组 如何来理解呢?以例说明。 某局有7个企业其某月的产值为: 88,90,96,98,110,140,200 1、不分组 分组后: 第一组:88,90,96,98 第二组:110,140,200 平均组内方差 (4)方差的简化计算: 计算: 方法一:甲组 乙组 例:甲农场小麦平均亩产量为500斤,标准差为50斤;乙农场小麦平均亩产量为100斤,标准差为50斤。哪个农场平均亩产量代表性高? 解: 五、是否标志的标准差 1、是否标志——是指用“是、否”或“有、无”将总体单位分为二部分的标志。 2、实质是将品质标志进行量化处理。 如: 合格品 男 全体 出勤 全部产品 不合格品 人口 女 职工 缺勤 (3)量化结果: 用“1”表示具有某一标志,其单位数为n1; 用“0”表示不具有此标志,其单位数为n0。 全部单位数n= n1+ n0 。 4、成数: 设p为具有某一标志的单位数占总体单位数的比重(或成数) p= n1 /n q为不具有某一标志的单位数占总体单位数的比重(或成数) q= n0 /n 显然,p+q=1 5、是否标志的平均数和标准差 计算列表如下: 例:某机械厂铸造车间生产6000吨铸件,合格品为5400吨。试计算其平均合格品率和标准差。 解:可以直接应用公式计算。 3-* 本章小结 测度集中趋势的各指标的含义、计算方法、特点和应用场合 测度离散程度的各指标的含义、计算方法、特点和应用场合 偏度与峰度的含义和测度方法 利用 Excel 计算描述统计量 * 3-* 第二节 统计变量离散程度的测定 一、测定离散程度的指标及其作用 二、极差、四分位差和平均差 三、方差和标准差 四、离散系数 五、异众比率 3-* 一则笑话 如果你一只脚放在摄氏 1 度的水里,另一只脚放在摄氏 79 度的水里,平均水温 40 度,你一定感觉很舒服 ? 显然,只了解变量的集中趋势是不够的! 3-* 一、测定离散程度的指标及其作用 1.说明数据的分散程度,反映变量的稳定性、均衡性。 数据之间差异越大,变量的稳定性或均衡性越差。 2.衡量平均数的代表性。 离散程度越大,平均数的代表性就越小。 3. 统计推断的重要依据 判别统计推断前提条件是否成立, 衡量推断效果好坏的重要尺度。 3-* 二、极差、四分位差和平均差 (一)极差(Range) 极差是一组数据的最大值(xmax)与最小值(xmin)之差,通常用 R 表示。 对于总体数据而言,极差也就是变量变化的范围或幅度大小,故也称为全距。 组距数列中,极差≈最高组的上限-最低组的下限。 优缺点:计算简便、含义直观、容易理解。它未考虑数据的中间分布情况,不能充分说明全部数据的差异程度。 3-* (二)四分位差 第3四分位数(Q3)与第1四分位数(Q1)之差,常用Qd表示。计算公式为: 实质上是两端各去掉四分之一的数据以后的极差,表示占全部数据一半的中间数据的离散程度。 四分位差越大,表示数据离散程度越大。 是在一定程度上对极差的一种改进,避免了极端值的干扰。但它对数据差异的反映仍然是不充分的。 四分位差是一种顺序统计量,适用于定序数据和定量数据。尤其是当用中位数来测度数据集中趋势时. 3-* (三)平均差(Average Deviation) 平均差——各个数据与其均值的离差绝对值的算术平均数,反映各个数据与其均值的平均差距,通常以A.D表示。计算公式为: 未分组数据: 平均差含义清晰,能全面地反映数据的离散程度。但取离差绝对值进行平均,数学处理上不够方便,在数学性质上也不是最优的。 已分组数据: 3-* 三、方差和标准差 1. 方差(Variance)的概念和计算 方差是各个数据与其均值的离差平方的算术平均数. 总体方差(σ2)的计算公式为: 未分组数据: 分组数据: 样本方差(通常用 S2 表示)分母应为(n -1)。 3-* 标准差(standard Deviation) 标准差——方差的算术平方根。 总体标准差一般用σ表示。其

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档