- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学--第三章统计数据处理
由连续型变量构成的组距数列,可用频率直方图来表现总体分布状况的。图形由一个个相连的长方形组成,每一长方形的面积则代表某一组变量出现次数占总次数的比重,因而所有长方形的面积之和等于100% 如果直方图中每一长方形顶端的中点连接起来,可得一条折线,称为分布折线。当无限的增加组数,致使组距无限的缩短,原来有限的长方形就被无限的分割,最终成为一根根直线,这时的折线就变成为一根光滑的曲线,称为分布曲线。累计频数或累计频率的图形应为折线或曲线,如下频数分布曲线。 在实践中,当离散型变量的取值很多,而且很难一一列举或没有必要一一列举的时候,也常常采用组距的形式编制变量数列。例如,某企业生产班组按工人人数分组的资料如表 某企业生产班组按工人人数分组资料 组距数列各组的取值的界限称为组限(class boundary),凡是各组变量取值的起点组限称为下限(lower limits);反之,各组变量取值的终点则称为上限(upper limits)。 对于连续型变量的组距数列,上下限之间的取值域为:下限≤变量 <上限 ,表示变量的取值从下限开始一直到上限、但不等于上限。 对于离散型变量的组距数列,由于变量的取值只能是整数,表变量的取值分别为: 5≤X≤9, 10≤X≤14, 15≤X≤19 在引进了组限的概念后,就可更深刻地理解:分别由连续型变量和离散型变量绘制频数(频率)直方图时、关于两个长方形的边界连接与否问题。也就是说,连续型变量相临两个组限,即数据较小的一组的上限和数据较大一组的下限是重叠的;而离散型变量组距数列相临两组的组限、即数据较小的一组的上限和数据较大一组的下限是分离的、不重叠的。 组距 = 上限 - 下限 组距数列有开口组(open end)数列和闭口组(closed end)数列之分,所谓开口组数列是指数列中同时不显示的第一组的下限和(或)最后一组的上限,即第一组只有上限而无下限、或者最后一组只有下限而无上限、或者两者皆无,开口组组距数列,适用于数据有极端值,数据不多且较分散的情况、或实际情况不祥得情况。 组距数列还有等距与不等距之分,等距数列指数列各组的组距全部相等;反之,不等距数列则为数列的各组组距不相等。 变量数列有以下特征 : 1.变量数列有两个基本要素:经过分组排序的变量值和频数(频率); 2.变量数列的各组频率分别大于等于0,变量数列的各组频率之和等于1。 等距数列的编制步骤如下: ①计算全距 ②确定组数 ③计算组距,根据上述组数和组距,三者的数量关系为: ④计算组限、并在此基础上形成若干组。先计算第一组的组限,计算公式如下: 上限 = 最小值 + 组距/2 下限 = 最小值 - 组距/2 ⑤计点各组出现的次数(频数),计算频率,方法同单项数列的编制。 五 统计表与统计图 目录 (一)、统计表(statistical table) 把经过分组、汇总的数字资料按一定的循序在表格上反映出来,这种表格叫做统计表。 从形式上看,统计表是一张由纵横交叉的直线、左右两边不封口所组成的表格。 从内容上看,统计表由四部分组成: 1.总标题,用来简明扼要地概括表格的全部内容,一般置于整个表的正上方; 2.横行标目,是总体各组或各单位的名称,是统计研究的对象和主体,所以也称主词。 3.纵栏标目,指说明总体某一方面特征和属性的指标名称,是用来说明被研究对象或主题的; 4.数字资料,指反映总体各项特征或属性的指标数值,置于表格的右下方,即总体各组或各单位与其相对应指标的交叉处。 (二)、统计图(statistical graph or cartogram) 统计图是展示数据特征的另一种形式。 常用的统计图主要有两大类: 一类是反映数据总体的分布状况的图形,如表示定性分布状况的饼图(pie chart) 另一类是反映两个变量之间关系的统计图:散点图、折线图和曲线图。 * 第三章 统计数据处理 目录 一、统计数据的涵义及其层次尺度 二、统计数据处理的概念和内容 三、频数分布 四、统计调查方案 五、统计表与统计图 一 统计数据的涵义及其层次 目录 (一)、统计数据的涵义与分类 统计数据(statistical data)简称数据(data),是变量(包括定性和定量变量)的取值,也就是说统计数据是对所研究对象的属性和特征的具体描述,包括定性量变量的文字描述和定量变量的数字描述。 统计数据的分类 时空形态 时间序列数据:按时间顺序排列的数据 截面数据:一个或多个变量在某一时点上的数据的集合 面板数据:截面数据与时间数列综合起来的一种数据 内在性质 定性数据:一些用文字表示的无量纲,如产品有合格、不合格之分、性别有男、女之分等 定量数
您可能关注的文档
- 纯化水风险.doc
- 级的热力计算练习题.ppt
- 纪念辛亥百年.pptx
- 纳税会计第七章车船税(新).ppt
- 红色文化墙内容参考.doc
- 级功率和效率.ppt
- 纳税实务1.ppt
- 纵剪生产线速度匹配控制设计.doc
- 红外热成像图片-经典收藏.doc
- 纳米材料7.pptx
- 甘肃省白银市会宁县第一中学2025届高三3月份第一次模拟考试化学试卷含解析.doc
- 2025届吉林市第一中学高考考前模拟生物试题含解析.doc
- 四川省三台县芦溪中学2025届高三下第一次测试生物试题含解析.doc
- 2025届江苏省启东市吕四中学高三适应性调研考试历史试题含解析.doc
- 浙江省宁波市十校2025届高三二诊模拟考试历史试卷含解析.doc
- 甘肃省甘南2025届高考生物必刷试卷含解析.doc
- 河北省石家庄市一中、唐山一中等“五个一”名校2025届高考历史四模试卷含解析.doc
- 江西省南昌市进贤一中2025届高考生物考前最后一卷预测卷含解析.doc
- 甘肃省白银市会宁县第四中学2025届高三第二次模拟考试历史试卷含解析.doc
- 宁夏银川市宁夏大学附属中学2025届高考化学押题试卷含解析.doc
文档评论(0)