统计讲稿 第四章_统计整理.ppt

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计讲稿 第四章_统计整理

第四章 统计整理 对总体只按一个标志进行分组,称为简单分组。如:以产值作为划分企业规模的标志;按文化程度对人口总体进行分组。 统计对总体往往要从多方面进行研究,仅仅依赖一个分组标志进行分组是难以满足需要的,必须运用多个分组标志进行多种分组,形成一个分组体系,才能满足需要。 统计分组体系就是根据统计分析的要求,通过对同一总体进行多种不同分组而形成的一种相互联系、相互补充,能从总体在各种特殊性质意义上的量来加深对社会经济现象总体数量表现的认识的体系。 例如,对于国民经济总体进行统计研究,必须通过按部门、按所有制、按地区、按主管系统等多种分组,才能得到比较深刻的认识。这就是国民经分组体系。 统计分组体系可分为平行分组体系与复合分组体系。 对同一总体选择两个或两个以上的标志分别进行简单分组然后并列在一起就形成平行分组体系。 例如,为了认识人口总体的自然构成,可以分别选择性别、民族、文化程度、年龄等四个分组标志进行分组,得到如下分组体系。(下一张) 平行分组体系的特点是,每一分组只能固定一个因素对差异的影响,不能固定其他因素对差异的影响。 例如,男子组.女子组中性别的差异已被固定;各民族组中民族的差异已被固定;但这些组中其他因素的差异都依然存在。 对同一总体选择两个或两个以上的标志层叠进行分组,就形成复合分组体系。 例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、学制、性别等三个标志进行复合分组,得到如下分组体系。 建立复合分组体系,应根据统计分析的要求,在选择分组标志的同时,确定它们的主次顺序。首先按主要的标志对总体进行第一次分组;然后按次要的标志对第一次所分的组再进行第二次分组;依次按所有标志分至最后一层为止。 复合分组体系的特点是,第一次分组只固定一个因素对差异的影响、第二次分组则同时固定两个因素对差异的影响,当最后一次分组时,则所有被选择标志对差异的影响已全部被固定。 例如,理科、文科组中只固定了学科一个因素的差异,但仍存在着学制及性别的差异。在两组下再分的本科、专科组中,则已固定了学科、学制两个因素的差异,但仍存在着性别的差别。而最后分的男、女组中,则所有被选择标志各因素的差异部已被固定。即这些组中的学生,他们的学科、学制、性别全部是相同的。 分组标志确定之后,必须解决分组组数和各组界限的划分,即分组的具体方法问题。 根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。 按品质标志分组,就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。 例如,人口总体按性别,分为男、女两组; 再如,企业总体按所有制,分为全民、集体、合营、个体等组。 按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。 例如,居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。 就具体的分组形式而言,如果变量的变异较小,我们可以将每个变量值单列一组,这种分组称为单项式分组。 如果变量的变异较大,则可以把变量的整个取值范围依次划分为若干个区间,一个区间内的所有变量值归为一组。 区间的最大值称为上限,最小值称为下限,上限与下限之差为组距,即 组距=区间的最大值(上限)-区间的最小值(下限)……(1) 这样的分组称为组距式分组。 按总体内各组组距是否完全相等,数量标志分组又可以分为等距式分组与异距式分组。 等距式分组适用于总体各单位的变量值由小到大呈现均匀变化的情况。 异距式分组则适用于总体各单位的变量值由小到大呈现不均匀变化的情况。 各种分组举例如表4-3。 变量按其变量值能否无限分割可以分为离散型变量和连续型变量。例如表4-3中,例1、例2、例4中的变量均为离散型变量,例3和例5中的变量为连续型变量。 一般来说,离散型变量既可以来用单项式分组,也能够采用组距式分组;而连续型变量只能采用组距式分组,不能采用单项式分组。因为连续型变量的取值能够无限分割,变量值有无穷多个。 在采用组距式分组中,两种变量类型在组限的表示方法上也有不同。 离散型变量下各相邻组的组限可以间断,如例2中第一组的上限为999人,第二组的下限为1000人,两者不相重叠。 连续型变量的各相邻组的组限必须重叠,如例3中第—组的上限为80元,第二组的下限为80元,两者重叠。为保证重叠后不致发生“80元”究竟归属第几组的混乱,习惯上规定各组一般均只包括本组下限变量值而不包括上限变量值。上例80元应归入第二组。 根据分组标志特征的不同.分布数列可以分为属性分布数列与变量分布数列两种。 按品质标志分

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档