第二章__例题14.04.23.ppt

  1. 1、本文档共86页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章__例题14.04.23

* 方差是标准差的平方标准差方差的算术平方根,如何区别? 方差把原来数据的计量单位(量纲)升级了,如:原来单位是厘米,平方后成了平方厘米,零件个数成了“个”的平方,没有意义,为了避免量纲前后不一致,再开方。 方差(Variance)及标准差(Standard deviation) 简单平均式 上例: 加权平均式 样本方差和标准差 (simple variance and standard deviation) 未分组数据: 组距分组数据: 未分组数据: 组距分组数据: 方差的计算公式 标准差的计算公式 注意: 样本方差用自由度n-1去除! 五、 离散系数越小代表性越好 例:甲、乙两商店营业员及销售额的分组资料如下 甲商店 乙商店 组中值x 人数f xf 组中值x 人数f xf 25 35 45 55 65 3 12 9 6 —— 75 420 405 330 —— 768 432 144 1176 —— 25 35 45 55 65 —— 2 8 6 4 —— 70 360 330 260 —— 512 288 96 784 合计 30 1230 2520 合计 20 1020 1680 试问两个商店营业员平均销售额的代表性哪个大?为什么? 解 例:对成年和幼儿身高进行调查资料如下: 成年组(厘米):161 163 165 167 169 幼儿组(厘米):73 74 75 76 77 哪一组平均身高的代表性更大? 用“是”、“否”或“有”、“无”来表示的标志——是非标志。 总体单位数用N来表示。 表示具有所研究标志值的单位数, 表示不具有所研究标志的单位数。 是非标志(比例)的标准差 是非标志的平均数 五、标准化数值(Z-Score) 标准化数值是一个数据在数据集中相对位置的测度。 计算公式为 标准化数值就是数据值偏离平均数标准差的个数。正的z值表示观察值位于平均数右侧,负的z值表示观察值位于平均数左侧。 根据经验法则,对于钟形分布,几乎所有的数据都在偏离平均数3个标准差范围之内。因此,标准化数值低于-3或高于3的数据值就是异常值,也称为离群点。 1、假设下面数据是A公司和B公司的供货天数: A:11 10 9 10 11 11 10 11 10 10 B: 8 10 13 7 10 11 10 7 15 12 利用全距和标准差来证明A公司供货时间上更具有一致性和可靠性。 2、下面数据是某大学田径队的队员跑400米和1500米的时间(分钟) 400米: 0.92 0.98 1.04 0.90 0.99 1500米:4.52 4.35 4.60 4.70 4.50 一名教练看了以上样本后断言,400米耗时更具有一致性。 对不对?为什么? 练习: 分类数据离中趋势测度 异众比率(variation ratio) 1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比率 3. 计算公式为 4. 用于衡量众数的代表性 例:计算异众比率 解: 在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好 不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比(%) 可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 15 11 9 6 9 0.30 0.22 0.18 0.12 0.18 30 22 18 12 18 合计 50 1 100 数据类型与离散程度测度值 数据类型和所适用的离散程度测度值 数据类型 分类数据 顺序数据 数值型数据 适 用 的 测 度 值 ※异众比率 ※四分位差 ※方差或标准差 — 异众比率 ※离散系数(比较时用) — — 平均差 — — 极差 — — 四分位差 — — 异众比率 集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。偏态和峰度就是对这些分布特征的近一步描述。 第3节 偏度与峰度的测定 一、偏度及其测定 如果次数分布是完全对称的,叫对称分布;如果次数分布不是完全对称的,就称为偏态分布。所谓偏度,就是指次数分布的非对称程度,以偏态系数来表示。 0,说明是左偏 0,说明是右偏 二、峰度及其测定 峰度是分布集中趋势高峰的形状。它

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档