- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
各种科学研究的结果大多以数据的形式出现,这些直接获得的数据称为原始数据或观测数据,他们纷乱无章,只有经过整理分析才能从中提取出有用的信息构成规律性的知识。 第一节 数据的初步整理 一、数据排序 二、统计分组 三、统计表 四、统计图 统计图和统计表是两种是对数据进行简化的两种最简单的方式。 把统计指标和被说明的事物之间的关系用表格的形式表示就是统计表。(简明,清晰,准确) 统计图是依据数字资料,应用点、线、画、面、体、色等描绘而成。(具体形象) 一、数据排序 数据排序(order)就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。 排列后会使数据之间的某种关系有所显示。 数据排序是整理数据最简单的方法。 排序方法:升序和降序。 不同数据的排序 (一)字符型数据 汉字按拼音或笔画;英文按字母顺序。 (二)数值型数据 排序后可以划分等级,确定名次。 等级的划分要看数据及其所反映的事物本身的性质和研究目的而定。如智商、身高、跑步时间、错误次数等。 二、统计分组 所谓统计分组(grouping),就是根据被研究对象的特征,将所得数据划分到各个组别中去。 (一)统计分组前的准备 (二)统计分组应注意的问题 (三)分组的标志 (一)统计分组前的准备 将数据进行分组前,先要对观测数据做进一步的核对和校验。 核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。 (如果有充分的理由证明某个数据是受到了过失的影响,可考虑将此数据删除,否则不能随意删除。对于一些变异性较大的数据,要遵循三个标准差的准则。) (二)统计分组应注意的问题 1、分组要以被研究对象的本质特征为基础。(如:智力测验的结果,可按言语智力、操作智力和总的智力分数分类。) 2、分类标志要明确,要能包括所有的数据。 (三)分组的标志 两种分组: 性质类别 主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。(按性别分为男女,按年龄分为老年、中年和青年) 数量类别 这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。 三、统计表 基本内容 1、线条 原则:越少越好。 基本线 辅助线 2、标题和表号 1)标题:表的名称 原则 阿拉伯数字 数位对齐 不留空格 不带单位或%(放在标目中) 5、表注 四、统计图 制图要求 图形类型 统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。 统计图的基本内容 图轴 图形 主要内容 线条最粗 其他 图注:补充说明; 图轴比例:纵横之比,3:5; 第二节 次数分布表 一. 简单次数分布表 二. 分组次数分布表的编制 次数分布(frequency distribution)显示初步整理后一组数据的分布情况,如:同一观测值出现的次数,每一个分数区间内包含的观测分数的个数,主要表示数据在各个分组区间内的散布情况。 一、简单次数分布表 简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。 二、分组次数分布表表的编制 (一)次数分布表的编制 1、求全距(range):全部数据的距离,即极差。 Rg=Xmax-Xmin ?计算法:总体正态时 3、定组限——每组的起止点,也叫分组区间。 组限有表述组限和精确组限两种。 一组组距为10的分组数据,它们的表述组限为:10~19,20~29,30~39,40~49; 它们的精确组限(实际组限)为:9.5~19.499, 19.5~29.499,29.5~39.499等。 组限的三种表达方式: 10~19 [9.5~19.5) 10~ 在呈现表格时,一般用表述组限,但对数据进行归类时,一定要按实际组限。 4、登记频数(frequency) ?某事件在某类的数目。 ?方法:选举唱票法。 计算组中值(mid-point): (二)分组次数分布表的意义与缺点 意义:可将一堆杂乱无序的数据排列成序。 缺点: ⑴原始数据不见了,根据组中值计算出的平均值和用原始数据计算出的平均值是有出入的。这个误差,我们称为“归组效应”。(次数分布表假定各区间的数据分布是均匀的,但实际上并不一定均匀。 ⑵同一组数据,分组的组距越大,分组
文档评论(0)