- 1、本文档共93页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 统计数据的概括性描述 第三章 统计数据的概括性描述 第一节 统计数据的整理与展示 第二节 数据集位置的测度 第三节 数据集离散程度的测度 第四节 数据集的峰度与偏度 学习目标 了解数据预处理的内容和目的 掌握分配数列的整理与显示方法 掌握数据集的位置测度的变量与方法 掌握数据集的离散程度测度的变量与方法 掌握数据集的分布形态测度的变量与方法 用SPSS作频数分布表和形图 案例与背景 统计数据首先需要经过预处理和整理,以便人们对数据分布的类型和特点有了一个大概的了解。但这种了解并不能帮助我们准确地描述出统计数据的分布,还需要更深入的分析,找到能反映数据分布特征的各个代表值。对统计数据分布的特征和规律,可以从本章所介绍的三个方面进行测度和描述:一是数据集位置的测度,反映各数据向其中心值靠拢或聚集的程度;二是数据集离散程度,反映各数据远离其中心值的趋势;三是数据集的峰度与偏度,反映数据分布的形状。这三个方面从不同侧面反映了数据分布特征。本章将重点介绍这些代表值的计算方法、特点及其应用。 3.1.1 数据的预处理 数据的审核 检查数据中的错误 数据的筛选 找出符合条件的数据 数据排序 升序和降序 寻找数据的基本特征 数据审核—原始数据(raw data) ? 审核的内容 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等 数据的审核—原始数据(raw data) ?审核数据准确性的方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对分类和顺序据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误 主要用于对数值型数据的审核 数据的审核—二手数据(second hand data) 适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定数据是否符合自己分析研究的需要 时效性审核 尽可能使用必威体育精装版的数据 确认是否必要做进一步的加工整理 数据筛选(data filter) 当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容包括 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔 数据筛选(data filter) 用SPSS进行数据筛选 数据排序 (data rank) 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成 数据排序 (方法) 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n) 递减排序:可表示为:x(1)x(2)…x(n) 3.1.2 频数分布表的编制与图示 频数与频数分布 统计分组 品质数列的整理和显示 变量数列的整理和显示 频数分布的类型 1. 频数与频数分布 频数分布数列的概念 在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组简的分布,又称次数分配或分布数列。 频数(frequency) :又叫次数,落在各类别中的数据(单位)个数,记作 Fi 。 频率(ratio) :又叫比率,各组次数(频数)与总次数(频数)之比。 频率分布的性质: 分配数列的种类 品质分配数列(属性分布数列) :按品质标志分组形成的分配数列。 变量分配数列(变量分布数列) :按数量标志分组形成的分配数列。 单项数列:总体按单项式分组而形成的变量数列,每个变量值是一个组,顺序排列。 组距数列:总体按组距式分组而形成的变量数列,每个组是由若干个变量值形成的区间表示。 2. 统计分组 统计分组—概念: 是根据统计研究的目的,选择某一主要标志,将总体单位划分为若干类型或组别,使组内具有同质性,组间具有差异性。 统计分组—作用 划分现象的类型 揭示现象内部结构 分析现象之间的依存关系 统计分组—分组标志的选择 统计分组的关键问题:如何选择分组标志和确定各组的界限。 根据统计研究的目的来选择 在满足研究目的的前提下,应选择本质的、主要的,而不是非本质的、次要的标志。 考虑具体的历史和经济条件。 简单分组、复合分组和分组体系 根据采用的分组标志的多少,可以分为: 简单分组 复合分组 简单分组 又称单一
文档评论(0)