网站大量收购独家精品文档,联系QQ:2885784924
  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS次课

第7 章 连续变量的统计描述与参数估计 0903 第三次课 7.1 连续变量的统计描述指标体系 如果用统计指标对年龄等连续变量加以描述,则主要表现为以下几个方面: --集中趋势(Central Tendency) --离散趋势(Dispersion Tendency) --分布特征(Distribution Tendency) --其他趋势 7.1.1 集中趋势的描述指标 在统计学中用于描述集中趋势,或者数据分布的中心位置的统计量就被称为位置统计量(Location Statistic)。 1. 算术均数 (Arithmetic Mean) 2. 中位数 (Median) 3. 其他集中趋势描述指标 (1)截尾均数 (2)几何均数 (3)众数 (Mode) (4)调和均数 算术均数 总体均数用( μ )表示;样本均数用( )表示。 均数是最常用的集中趋势描述指标,但是它不适用于对严重偏态分布的变量进行描述。 思考:什么是严重偏态分布的变量?举例说明。 只有分布资料单峰和基本对称时使用均数作为集中趋势描述的统计量才是合理的。 中位数 中位数是全体数据按大小顺序排列,在整个数列中处于中间位置的那个值。 思考:09 social work 数据库中的“最后总分”变量,它的中位置是多少?(72) 中位值将全部数值分成两部分,把它大和比它小的数值个数正好相等,具体而言: (1)当n为奇数时,M=( ); 当n为偶数时,M=( )。 (2)由于中位数是位置平均数,因此不受极端值的影响,在具有个别极大值或极小值的分布数列中,中位数比算术平均数更具有代表性。 (3)由于中位数只考虑居中位置,对信息的利用不充分。因此对于对称分布的资料,分析者会优先考虑使用均数,只有当均数不能使用时采用中位数加以描述。 其它集中趋势描述指标 众数:众数指的是样本数据中出现频次最大的那个数,众数容易理解,也不受极端值影响,但不易确定,且没有太明确的统计特性,一般很少使用该指标。 7.1.2 离散趋势的描述指标 描述离散趋势的统计量称为尺度统计量(Scale Statistic),常用的尺度统计量有全距、方差、标准差、四分位间距等。 全距(Range)又称为极差,它是一组数据中最大值与最小值之差,是最简单的变异指标,但是过于简单,一般只用于预备性检查。 方差和标准差 离均差 对于每个数据而言,其离散程度的大小就是和均数的差值,简称离均差。 总体方差 用离均差平方和除以观察例数n。请大家尝试或依回忆写出它的公式。 总体方差公式 样本方差公式 ? 但是,方差在使用上存在不便,就是量纲不合常理,是原始指标量纲的平方。(思考:量纲是指……;如何解决?)。 解决方式是将方差开平方,就是所谓的标准差(Standard Deviation),总体和样本的标准差分别用( σ)和( s)来表示。公式分别为 ? 如果方差和标准差较小,则说明分布比较集中(集中在均值附件),反之,则比较离散。?在右侧的两幅图中,哪一个分布集中?哪一个分布离散?哪一个方差和标准差大,哪一个小? 由于标准差和方差的计算涉及每一个变量值,所以他们所反映的信息在离散指标中是最全的,是最理想的、最可靠的变异描述指标。 但也正是由于标注差和方差的计算涉及每一个变量值,所以它们也会受到极端值的影响,当数据中有较明显的极端值时不宜使用。 实际上方差和标准差的适用范围应当是服从正态分布的数据。 四分位数和四分位间距 通常将数据按从小到大的顺序排列后,用三个四分位数点Q1、Q2和Q3将其分成四部分。Q1是第25百分位点,Q2 是第50百分位点,也叫中位数,Q3是第75百分位点。 ? 四分位间距也叫四分位差,简称IQR,是Q1和Q3之间的距离。四分位间距常常和中位数一起用来描述一个定距特别是定序测量数据的分布。 ? 四分位间距即排除了两侧极端值的影响,又能够反映较多数据的离散程度,是当方差、标准差不适用时较好的离散程度描述指标。 四分位数求法见讲义p2。 自由度 本堂课作业一: 自由度 对自由度的简要介绍:假定只有n=1个观测值,我们仍然可以计算均值,但却无法考虑分布的形状。例如,我们从足球运动员中随机抽取了一名队员,他的身高为179cm,那么我们可以用它来估计队员的身高。但不可能知道队员身高分布的情况,究竟是174

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档