网站大量收购闲置独家精品文档,联系QQ:2885784924

第三章统计数据整理.pptVIP

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 统计数据的整理 第一节 统计整理概述 一、统计整理概念 统计数据的整理(summarizing data)是指对所搜集的数据进行加工整理、使之系统化、条理化,以符合分析的需要。   包括对原始资料的整理和次级资料的整理 统计资料的整理是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前提。 二、统计整理的程序 (一)设计统计整理方案 (二)对统计资料进行审核 (三)统计资料的分组与汇总 (四)编制统计图表 (五)统计资料的积累和保管 统计资料具体整理过程   统计数据的具体整理过程主要包括包 括数据的预处理、分类或分组、汇总等几 个方面。   一、数据的预处理 主要包括:数据的审核、筛选、排队 (一)、数据的审核与筛选 (一)、数据的审核与筛选   审核: 对第一手资料(直接调查或试验取得):审核其完整性与准确性 完整性审核:应调查的单位或个体是否有遗漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否正确。   对第二手资料(获取他人的资料):审核其完整性、准确性、适用性、时效性   筛选: 调查结束后,当对数据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。 筛选包括:剔除不符合要求的数据或有明显错误的数据;将符合特定条件的数据筛选出来。 (二)数据的排序 数据排序是按一定顺序将数据排列。 排序目的:通过浏览数据发现一些明显的特征趋势或解决问题的线索;有助于数据的检查纠错。 排序方式:数字型数据/字母型数据 :升序或降序; 汉字型数据:多种顺序 , 比如:拼音字母顺序或笔划顺序 。  第二节 统计分组  一统计分组的概念与种类   1、统计分组的概念   统计分组是将预处理过的数据按照某 种标志(特征或标准)分成不同性质的组。   统计分组标志:分组时所依据的特征 或标准,有品质标志和数量标志。      统计分组对总体而言是分,对于单位而言是合。由此可见,选择一种分组方法,突出一种差异,显示了一种矛盾,同时必然掩盖了其他差异。不同的分组方法,可能得出不同的结论。    2、统计分组的原则   穷尽性原则   互斥性原则 3、统计分组的种类 (1)按分组标志的多少,分为简单分组和复合分组。 (2)按分组标志的性质不同,分为品质标志分组(或称属性分组)和数量标志分组(或称变量分组) (3)按分组的作用和任务的不同,分为类型分组、结构分组和分析分组。 二统计分组的方法 1、品质标志的分组方法 关键是确定分组标志。一般比较简单,主要采用统一的分类标准。品质标志划分各组界限一般取决于统计分析对各组粗细的要求。但也要注意变异间的过度形态,是组限不易划分。例城乡划分。 2、数量标志的分组方法 关键是确定分组标志和确定分组界限。 ★分组数列的种类: 2、数量标志的分组方法 (1)单项式分组与组距式分组 单项式分组适用于离散型变量且变量变动范围不大的场合。比如育龄妇女按其生育子女存活数分组。 组距式分组适合于连续型变量或者变动范围较大的离散型变量。 (2)间断组距式分组和连续组距式分组 如果变量值只是在整数间变动,可采用间断组距式分组,也可采用连续组距式分组。比如企业数、职工人数等。 如果变量值在一定范围内的表现既可以是整数,也可以是小数,只能采用连续组距式分组。比如产值、身高、体重。 注意:“上限不在内”原则的应用。 (3)等距分组与异距分组 等距分组适用: 标志值变动比较均匀的情况。 异距分组适用: 标志值分布很不均匀的场合; 标志值相等的量具有不同意义的场合; 标志值按一定的比例发展变化的场合。 (4)组距、组数、组限与组中值的计算 组距=上限-下限= 本组上限-前组上限 =本组下限-前组下限 组数的确定: 经验上以5~20之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。 组数的确定: 实际分组时常按斯特格斯(Sturges) 提出的经验公式来确定组数K: 组中值计算: 组中值=(上限+下限)/2 第三节 频数分布   一、频数分布的基本概念 (一)频数:对分组后的

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档