网站大量收购闲置独家精品文档,联系QQ:2885784924

第三章 定量数据的描述方法.ppt

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 定量数据的描述方法

统 计 学 第3章 定量数据的描述方法 主要内容 3.1展示数据的分布 3.2定量数据的其他图形展示 3.3分布的集中位置 3.4分布的离散程度 3.5分布的形态度量 3.6标准得分 3.7利用描述方法扭曲事实 3.1展示数据的分布 3.1.1 3.1.2 箱线图 3.1.3 散点图 3.1展示数据的分布 3.1.1统计数据的分组 1.统计分组的概念 统计分组是指根据所研究事物的特点和统计研究的目的与任务,按照一定的分组标志将总体划分成若干个组成部分的一种统计方法。 2.分配数列的概念 在统计分组的基础上,将总体中的所有单位按组归类整理,并按一定顺序排列,形成总体单位数在各组间的分布,这个数列称为分配数列,又称分布数列或次数分布 、频数分布。 3.1展示数据的分布 3.1.1统计数据的分组 2000年底某地区的人口情况 3.1展示数据的分布 3.1.1统计数据的分组 某班学生的学习成绩情况 3.1展示数据的分布 3.1.1统计数据的分组 变量数列可分为单项式变量数列和组距式变量数列。 (1)单项式变量数列 单项式变量数列简称单项数列,它是数列中的每个组只用一个变量值表示的数列。 例如:某地区1997年家庭人口数抽样资料 3.1展示数据的分布 3.1.1统计数据的分组 例如 :某企业职工工资分配情况 3.变量数列的编制 (1) 单项式变量数列的编制 编制单项式变量数列必须具备两个条件: 一是变量是离散型变量; 二是变量值的个数不多。只有同时具备这两个条件才可采用单项变量数列形式。 3.变量数列的编制 (2)组距式变量数列的编制 编制组距式变量数列应具备两个条件: 一是适用于连续型变量; 二是离散型变量的变量值比较多。这种条件下,在编制变量数列时多数情况下采用组距数列。 分配数列的编制 (例题分析) 次数分配表 3.1展示数据的分布 3.1.2直方图(histogram) 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布; 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图; 直方图下的总面积等于1。 分组数据的图示 (直方图的绘制) 3.1展示数据的分布 3.1.3频数折线图(frequency polygon) 频数折线图也称频数多边形图、折线图; 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉; 折线图的两个终点要与横轴相交,具体的做法是: 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴; 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的; 分组数据的图示 (折线图的绘制) 次数分配的类型 3.1展示数据的分布 3.1.4茎叶图(stem-and-leaf plot) 用于显示未分组的原始数据的分布; 由“茎”和“叶”两部分构成,其图形是由数字组成的; 以该组数据的高位数值作树茎,低位数字作树叶; 树叶上只保留一位数字; 茎叶图类似于横置的直方图,但又有区别: 直方图可观察一组数据的分布状况,但没有给出具体的数值; 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息; 茎叶图 (例题分析) 茎叶图 (扩展的茎叶图) 3.1展示数据的分布 3.1.5累计频数分布(cumulative frequency distribution) 洛伦茨曲线 20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成; 描述收入和财富分配性质的曲线分析该国家或地区分配的平均程度。 基尼系数 20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标; A表示实际收入曲线与绝对平均线之间的面积; B表示实际收入曲线与绝对不平均线之间的面积; 如果A=0,则基尼系数=0,表示收入绝对平均; 如果B=0,则基尼系数=1,表示收入绝对不平均; 基尼系数在0 和1之间取值; 一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。 3.2定量数据的其他图形表示 3.2.1 线图 3.2.2 箱线图 3.2.3 散点图 3.2定量数据的其他图形表示 3.2.1线图(line chart

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档