应用统计学第4章-数据分布特征的度量.ppt

应用统计学第4章-数据分布特征的度量.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用统计学第4章-数据分布特征的度量

自由度(degree of freedom) 样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 为什么样本方差的自由度是n-1呢?因为在计算离差平方和时,必须先求出样本均值?x ,而?x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个 样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差σ2时,它是σ2的无偏估计量 * 样本标准差 * 某电脑公司销售量数据平均差计算表 按销售量分组 组中值(Mi) 频数(fi) 140~150 150 ~ 160 160 ~170 170 ~180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~220 220 ~230 230 ~240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计 — 120 — 55400 数据分布数量的估计(经验法则) * Z值 若数据型态为钟形时,为了解观察值在数据中的位置,可计算Z值。 样本值 的Z值: 母体 值的Z值: * Z值 设A班学生的成绩平均为75分,标准偏差为10分,而A班同学甲的成绩为70分,则70分的Z值为: 表示同学甲的成绩低于平均数0.5个标准偏差。 * Z值 又如B班学生的平均成绩为65分,标准偏差为10,而B班学生乙的成绩为70分,则70分的Z值为: 表示学生乙的成绩高于平均数0.5个标准偏差。 * 切比雪夫不等式 (Chebyshev’s inequality ) 适用任何分布形状的数据 对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在k个标准差之内。其中k是大于1的任意值,但不一定是整数 * 切比雪夫不等式 (Chebyshev’s inequality ) 对于k=2,3,4,该不等式的含义是 至少有75%的数据落在平均数加减2个标准差的范围之内 至少有89%的数据落在平均数加减3个标准差的范围之内 至少有94%的数据落在平均数加减4个标准差的范围之内 * 切比雪夫不等式 (Chebyshev’s inequality ) 100個學生統計學平均成績為75分,標準差為5分: 成績在 75 ? 2 ? 5 = 65 ~ 85 分的同學至少有75位 成績在 75 ? 3 ? 5 = 60 ~ 90 分的同學至少有89位 * 本章要点 集中趋势 离散趋势 分类数据:异众比率 顺序数据:极差與四分位差 数值型数据:方差和标准差 相对离散程度:离散系数 * 离散系数(coefficient of variation) 标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 用于对不同组别数据离散程度的比较 计算公式为 * 离散系数 * 某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) x1 销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度 离散系数 * 结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 v1= 536.25 309.19 =0.577 v2= 32.5215 23.09 =0.710 数据类型与离散程度测度值 * 数据类型和所适用的离散程度测度值 数据类型 分类数据 顺序数据 数值型数据 适 用 的 测 度 值 ※异众比率 ※四分位差 ※方差或标准差 — 异众比率 ※离散系数(比较时用) — — 平均差 — — 极差 — — 四分位差 — — 异众比率 本章要点 集中趋势 离散趋势 偏态与峰态 * 偏态与峰态分布的形状 * 扁平分布 尖峰分布 偏态 峰态 左偏分布 右偏分布 与标准正态分布比较! 偏态系数 偏态系数的计算公式: 其中 偏态方向和程度的判别:按上面公式计算出来的偏度指标,其符号可以表

文档评论(0)

wnqwwy20 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档