- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]商务与经济统计03-描述性统计方法
Chapter 3 描述性统计: 数量方法 本章主要内容 数据位置测度 数据变异性测度 相对位置的测度与异常值的判断 探索性数据分析 双变量相关关系测度 加权平均值与分组数据的加权平均值 位置测度 平均值 中位数 众数 百分位数 四分位数 举例: 保单成本 为了了解保单的成本情况,抽取了70份保单,计算其成本分别如下(单位:元): 平均值 样本平均值计算公式: 总体平均值计算公式: 平均值 中位数 一些非常大或非常小的数据会影响平均值的代表性,中位数可以避免这个问题 中位数是指将数据从小到大排列后,位于中间位置的那个数 如果数据个数是奇数,中位数就是中间位置的那个数 如果数据是偶数,中位数是中间两个数的平均值 中位数 在70个数据中,位于第35和第36个的数据都是475,所以中位数 = (475 + 475)/2 = 475 众数 众数是指数据集中出现次数最多的那个数 如果有两个数据都出现了最多次数,即有两个众数。如果数据集中出现了多于两个的众数,众数就没有考察的意义 众数 450 出现的次数最多 (7 次) 众数 = 450 百分位数 百份位数可以显示数据是如何在最小值到最大值之间分布的 例如考试成绩通常会根据百分位数划分区间 百分位数 如何计算第p个百分位数 将数据从小到大排列 计算第p个百分位数的位置i i = (p/100)n 如果 i 不是整数,向上取整,即比 i 大的下一个整数就是第p 个百分位数的位置 如果 i 是整数,第 i 和第 i +1个数的平均数就是第p个百分位数 第90个百分位数 i = (p/100)n = (90/100)70 = 63 第63和第64个数据的平均值即为第90个百分位数 (580 + 590)/2 = 585 四份位数 四分位数实际上就是几个特殊的百分位数 第一个四分位数 = 第25个百分位数 第二个四分位数 = 第50个百分位数 = 中位数 第三个四分位数 = 第75个百分位数 第三个四分位数 第3个四分位数 = 第75个百分位数 i = (p/100)n = (75/100)70 = 52.5 = 53 第3个四分位数 = 525 数据变异性测度 除了位置测度以外,通常还需要对数据的离散性或变异性进行测度 变异性测度 全距 四分位数间距 方差 标准差 变异系数 全距 全距是测度数据变异性的最简单的方法 全距 = 最大值 – 最小值 全距很容易受到极端值的影响 全距 全距= 615 - 425 = 190 四分位数间距 四分位数间距等于第三个四分位数减去第一个四分位数,反映的是位于中间的50%的数据间距 四分位数克服了全距容易受极端值影响的缺点 四分位数间距 第3个百分位数(Q3) = 525 第1个百分位数 (Q1) = 445 四分位数间距 = Q3 - Q1 = 525 - 445 = 80 方差 方差利用了数据集中的所有数据对数据的离散度和变异性进行测度 方差考察所有的数据(xi) 与平均值之间的差异 方差 样本方差用s2表示,计算公式如下: 总体方差用? 2,计算公式如下: 标准差 标准差等于方差的算术平方根 标准差的单位与数据的单位相同,因此比方差更容易与平均值或原始单位相比较 样本标准差用 s 表示 总体标准差用 ? 表示 变异系数 变异系数用来表示标准差与平均值的比值 样本变异系数 总体变异系数 方差 标准差 变异系数 相对位置的测度与异常值的判断 Z值 Chebyshev定理 经验法则 异常值的判断 Z值 Z值通常称为标准化值 用Z值表示数据 xi 偏离平均值多少个标准差 小于平均值的数据其Z值小于零 大于平均值的数据其Z值大于零 等于平均值的数据其Z值等于零 Z值 Chebyshev定理 在任何数据集中,至少有 (1 - 1/z2) 的数据在平均值+Z个标准差的范围内,其中Z是任何大于1的数 至少 75% 的数据在平均值+两倍标准差的范围内 至少 89% 的数据在平均值+两倍标准差的范围内 至少 94% 的数据在平均值+两倍标准差的范围内 举例 如果 z = 1.5, = 490.80 ,s = 54.74 至少 (1 - 1/(1.5)2) = 1 - 0.44 = 0.56 即 56% 的数据在 - z(s) = 490.80 - 1.5(54.74) = 409
文档评论(0)