- 1、本文档共53页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * Location (Position) Concerned with where values are concentrated. Variation (Dispersion) Concerned with the extent to which values vary. Shape Concerned with extent to which values are symmetrically distributed. 3-* 3-* 3.3 百分位数、四分位数与盒式图 将数据递增排序,对于某个数值X,如果有p%的数据小于它,则称X为第p百分位数(percentile) 第10百分位数 第90百分位数 第25百分位数称为下四分位数或第一四分位数(first quartile )记为Q1 中位数、第50百分位数、第二四分位数 第75百分位数称为上四分位数或第三四分位数(third quartile )记为Q3 (Q3 - Q1)内距 或四分位差(interquartile range)记为 IQR 3-* 3-* 计算百分位数 将数据按递增排序 计算指数i = (p/100)n ,n为样本容量 如果i不是整数,取比i的整数,这个整数表示p百分位数的位置 如果i是整数,则p百分位数是递增顺序排列中位置i与i+1的平均值 3-* Example (p=10th Percentile) i = (10/100)12 = 1.2 不是整数,取2 第10百分位数为11,070 7,524 11,070 18,211 26,817 36,551 41,286 49,312 57,283 72,814 90,416 135,540 190,250 3-* 五数概括法 最小值 第一四分位数Q1 中位数Md 第三四分位数Q3 最大值 盒子-胡须图(Box-and-Whiskers Plots) 五数概括的一种扩展,用Q1、Md、Q3以及四分位差绘制 随机抽取20顾客对某品牌电脑的满意度进行评分(1-10分) 3-* 1 3 5 5 7 8 8 8 8 8 8 9 9 9 9 9 10 10 10 10 计算 Q1=7.5,Md=8,Q3=9,IQR=1.5 内栏(inner fence):(Q1-1.5IQR)至(Q3+1.5IQR)区间 外栏(outer fence):(Q1-3IQR)至(Q3+3IQR)区间 胡须的画法:找到Q1到内栏间的最小值以及Q3到内栏间的最大值 3-* 找出异常值 轻微异常值(mild outlier):内栏与外栏间的数值 极端异常值(extreme outlier):外栏之外的数值 3-* 3-* Figure 3.19 3-* MegaStat绘制的盒式图 3-* 3.4 加权与分组数据 某些数值相对于其它数值可能更重要 变量值的重要程度,通常称为权重(weight) 加权均值与加权方差 案例:支持率的计算 民调地区 选民(百万) 支持率 东北部 26.9 40.1% 南部 50.6 47.2% 中南部 34.6 45.1% 西部 32.5 39.2% 3-* 3-* 分组数据的统计描述 概括成频数分布或直方图的数据 原始数据无法观测到,只能看到每组的上下限和频数 利用组中值和频数计算均值和方差 属于加权形式 3-* 分组数据的均值和方差 * 3.5 几何平均数(geometric mean) n 个变量值乘积的 n 次方根 适用于对比率数据的平均,尤其是时序数据 主要用于计算平均增长率、平均收益率 计算公式为 5. 可看作是均值的一种变形 * 一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 算术平均: 几何平均: 案例:股票投资平均收益率 * 平均发展速度、增长速度 通常用几何平均法求得。计算公式为: 案例:人口2000年-2007年平均增长率 2000年 2001年 2002年 2003年 2004年 2005年 2006年 2007年 126743 127627 128453 129227 129988 130756 131448 132129 3-* * 3.6 偏度与峰度 统计学家Pearson于1895年首次提出偏度(skewness) 数据分布偏斜程度的测度 偏态系数=0为对称分布 偏态系数 0为右偏分布 偏态系数 0为左偏分布 * 偏态系数 (skewness coefficient) 根据原始数据计算 根据分组数据计算 * 峰态(k
文档评论(0)