统计学第二章描述.pptVIP

  1. 1、本文档共107页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学第二章描述

本章重点 詹姆斯 杜兰特 詹姆斯 杜兰特 詹姆斯 分布形态 钟型分布(bell shaped) 钟型分布中间观测值分布多,越往两侧分布越少。因其形状像钟而得名。 根据分布的对称性,钟型分布又可分为对称分布、左偏分布和右偏分布 对称分布(symmetry) 左偏(left skewed) 右偏(right skewed) 正态分布(normal distribution) 也叫高斯分布(gaussian distribution)是一种完美的、对称的钟型分布,可以用函数精确地表达出来 实践中大量的变量逼近正态分布,换而言之,一个变量大约成正态分布才是正常(normal)的 杜兰特 对比 双直方图( bi-histogram) 对比 描述 位置(location):中心(center) 尺度(scale):差异(variability)或离散(spread) 形态(shape) 第一节 位置 均值(mean) 众数 (mode) 中位数 (median) 分位数 (quantile) 均值 中位数 中间位置上的数 观测值从小到大排列 中间位置:(n-1)/2+1 中位数 排序: 中间位置:(n-1)/2+1=(101-1)/2+1=51 中位数:31 众数 分布次数(频数)最多的观测值 次数分布 找到分布最多的观测值 众数不一定存在,也不一定唯一 事实上,连续型变量很难精确地找到众数 众数位置 分布 众数 位置:最多分布为9 众数:33 分位数 q分位数:观测值从小到大排序后,q等分,处于分界点上的数 二分位数(中位数) 三分位数(tertiles) 四分位数(quartiles) 五分位数(quintiles) 六分位数(sextiles) 十分位数(deciles) 十二分位数(duo-deciles) 二十分位数(vigintiles) 百分位数(percentiles) 千分位数(permilles) 四分位数 观测值按大小顺序排列后,均分为四部分,处于分界点上的数 2/4位置:中位数 1/4位置:下四分位数 3/4位置:上四分位数 四分位数 詹姆斯: 杜兰特: 月薪 从某公司随机抽取13位职工,调查他们的月薪如下: 2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600 4000 四分位数位置 十分位数位置 分位数位置 第k个q分位数的位置: 位置汇总 均值:27.13 中位数:26 众数:25 下四分位数:22 上四分位数:32 练习 第二节 尺度 绝对平均差(average absolute deviation) 方差(variance) 标准差(standard deviation) 全距(range) 四分位距(inter-quartile range) 绝对中位差(median absolute deviation) 散点图 差异( 离散) 中心化( centering) 中心化 合计 绝对值 绝对平均差 平方 方差 自由度 计算样本方差时应除以n-1,而不是n 自由度? 标准差 变异系数( coefficient of variation) 全距 四分位距 绝对中位差 尺度汇总 绝对平均差: 6.31 方差: 67.3 标准差: 8.20 变异系数:0.302 全距: 54 四分位距: 10 绝对中位差:5 总体均值和方差 练习 极端值(extremes) 也叫离群值(outliers),指明显偏离主体数据的值。极端值应给予特别关注: 观测错误 特殊情况 判定 3倍标准差 1.5倍四分位距 准则 标准化(无尺度化) 准则 讨论 月薪 正常数据 有极大值数据 右偏 月薪 正常数据 有极小值数据 左偏 月薪 正常数据 既有极大值,又有极小值数据 尖峰(厚尾) 销量 正常数据 有极大值数据 位置描述 均值:50.1 中位数:48.5 众数:47 尺度描述 绝对平均差: 9.87 方差: 171.4 标准差: 13.1 变异系数:0.26 全距: 58 四分位距: 10 绝对中位差:6.5 稳健(robust) 诸如中位数、四分位距、绝对中位差的只受主体数据影响不受极端值影响的统计量成为稳健统计量 稳健统计量意味着缺乏敏感性 调整均值 中间均值(mid-mean):用25%——75%分位数之间的数据计算均值 切尾均值(trimmed mean):用5%——95%分位数之间的数据计算均值 缩尾均值

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档