- 1、本文档共53页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
心理与教育统计学03
恬静的统计学家改变了我们的世界;不是通过发现新的事实或者开发新技术,而是通过改变我们的推理、实验和观点的形成方式┅ Ian Hacking 数据分布的特征和测度 集中趋势 (Central tendency) §3.1 算术平均数 一、算术平均数的概念 算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 均 值 (概念要点) 1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于称名数据和顺序数据 1、观察值的总和等于算术平均数的N倍 2、各观察值与算术平均数之差的总和等于零。 3、若一组观察值是由两部分(或几部分)组成,这组观察值的算术平均数可以由组成部分的算术平均数而求得。 二、均值的计算方法 简单均值 (算例) 原始数据: 10 5 9 13 6 8 加权均值(算例) 均 值 (数学性质) 1. 各变量值与均值的离差之和等于零 均 值 (数学性质) 3. 每一个数加一个常数 C,所得均值等于原均值加上 常数 C 均值的特点与应用 优点:反应灵敏;计算简单、严密确定;适合进一步代数运算;受抽样变动的影响较小。 缺点:易受极端数据的影响;出现模糊不清得数据时,无法计算。 应用:数据同质性原则; 一组数据中每个数据都比较准确、可靠;无极端值的影响;而且还要通过它计算其他统计量。 §3.2 中位数和百分位数 一、中位数的概念: 中位数是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。 中位数 median (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值,记为 Md 1、原始数据的计算方法 顺序数据的中位数(算例) 数值型未分组数据的中位数 (5个数据的算例) 原始数据: 24 22 21 26 20 排 序: 20 21 22 24 26 位 置: 1 2 3 4 5 数值型未分组数据的中位数 (6个数据的算例) 原始数据: 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6 数值型分组数据的中位数(要点及计算公式) 根据位置公式确定中位数所在的组 采用下列近似公式计算: 数值型分组数据的中位数(算例) 三、百分位数的概念及其计算方法 1、百分位数的概念 百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。 在教育测量中,常通过计算某个原始分数所属的百分位数来说明、解释、评价它在团体中的位置。 2、百分位数的计算方法 中位数的特点与应用 优点:简单、容易理解,稳健。 缺点:不稳定、受抽样影响大;计算时不用所有数据;计算时要对数据先排序;总数乘以众数不等于数据的总和;不能作进一步代数运算。 应用:一般用在下列情形:当数据有极端值;两端数据或个别数据不清楚;需要快速估计一组数据的代表值。 §3.3 众数(mode) 一、众数的概念要点 集中趋势的测度值之一 出现次数最多的变量值,用 M0 表示 不受极端值的影响 可能没有众数或有几个众数 有理论众数与粗略众数 众数的不唯一性 无众数原始数据: 10 5 9 12 6 8 二、众数的计算方法 1、用观察法直接寻找粗略众数 例如,一组原始数据2、4、3、6、4、5、4 称名数据的众数(算例) 顺序数据的众数(算例) 2、用公式求理论众数的近似值: (1)皮尔逊的经验法: 频数分布呈正态或接近正态时才能使用。 金氏插补法 1. 众数的值与相邻两组频数的分布有关 数值型分组数据的众数(算例) 众数的特点与应用 优点:简单、容易理解。 缺点:不稳定、受分组影响;计算时不用所有数据;总数乘以众数不等于数据的总和;不能作进一步代数运算。 应用:一般用在下列情形:需要快速确定一组数据的代表值;数据不同质;当数据有极端值; 众数、中位数和均值的关系 众数、中位数、平均数的特点和应用 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分
文档评论(0)