网站大量收购独家精品文档,联系QQ:2885784924

统计学第2章数据的描述资料精要.ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 2 章 统计数据的描述 2.1 数据的整理 2.1.1 统计数据的分组 1、统计分组含义 按某个标志把总体划分为若干组,称为统计分组。 分组标志是划分数据的标准或依据 分组的性质来:兼有分和合双重含义。 2、统计分组的原则 穷尽原则 互斥原则 3、统计分组方法 品质标志分组 数量标志分组 品质分组 品质标志:性别、职业、所有制等。 分组标志一经确定,组名和组数也随之确定 品质分组所形成的数列称为品质数列 数量标志分组 首先,各组数量界限的确定必须能反映事物质的差别。 其次,应根据总体的数量特征,采用适当的分组形式。 单变量值分组 (要点) 1. 将一个变量值作为一组 2.适合于变量值较少的 离散变量 组距分组 (要点) 将变量值的一个区间作为一组 适合于连续变量和变量值较多的离散变量。 需要遵循“不重不漏”的原则 有等距分组和不等距分组 组距分组 (几个概念) 1. 下限(low limit) : 2. 上限(upper limit) : 3. 组距(class width) : 4. 组中值(class midpoint) : 开口组的组距:以相邻组的组距代替。 常以组中值来代表各组平均水平。 组距分组 (步骤) 确定组数: 斯特杰斯经验公式: 组数=1+3.3 Lg N 2.1.2 次数分配 P17 在分组的基础上,将所有单位归类并列出每一组的次数,称为次数分布或频数分布。 次数分布数列的两个要素 1)按某标志所分的组。 2)各组所出现的单位数,即频数,亦称次数。 一般用x表示变量;用f表示频数(次数)。 用直方形的宽度和高度来表示次数分布的图形。 绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。 分组数据的图示 折线图:折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成 分组数据的图示 (折线图的绘制) 曲线图:用平滑曲线连接各组次数坐标点即得分布曲线。 频数分布的类型 2.1.4 洛伦茨曲线与基尼系数 洛伦茨曲线 20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成 描述收入和财富分配性质的曲线 分析该国家或地区分配的平均程度 基尼系数 20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标 A表示实际收入曲线与绝对平均线之间的面积 B表示实际收入曲线与绝对不平均线之间的面积 如果A=0,则基尼系数=0,表示收入绝对平均 如果B=0,则基尼系数=1,表示收入绝对不平均 基尼系数在0 和1之间取值 一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。 集中趋势 (central tendency) 2.2.1 众数 (mode) 集中趋势的测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 众数 (不唯一性) 无众数 原始数据: 10 5 9 12 6 8 1、由单项数列求众数 某 车 间 工 人 日 产 情 2.由组距数列计算 首先确定次数最多的组,即众数组,然后,用公式计算。 2.2.2 中位数 (median) 排序后处于中间位置上的值 1、由未分组资料计算中位数 (1)由单项数列求中位数 例10:某生产车间120名工人生产某种零件的日产 量如下表所示,计算该车间工人日产量的中位数。 从某单位抽查800户,取得人均收入资料如下表, 计算该单位人均收入的中位数。 中位数位次=∑f/2=800/2=400,中位数组 在700-800这一组中。由下限公式 中位数的性质: 数据值与中位数之差的绝对值最小. 2.2.3 四分位数 (quartile) 1. 排序后处于25%和75%位置上的值 四分位数 2.2.4 均值 (mean) 1. 集中趋势的最常用的测度值 简单算术平均数(simple mean) 加权算术平均数 (weighted mean) (例题分析) (权数对均值的影响)P34 甲组: 考试成绩(x ): 0 20 100

您可能关注的文档

文档评论(0)

baobei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档