第8讲 SPSS基本统计分析解析.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
定类变量、定序变量、定距变量,定比变量: -------------------------------------------------------------------------------------------------------------------------------------- 变量的数据类别由低到高依次为:定类变量、定序变量、定距变量(定比变量)。 (1) Norminal Data 定类变量:变量的不同取值仅仅代表了不同类的事物,这样的变量叫定类变量。问卷的人口特征中最常使用的问题,而调查被访对象的“性别”,就是定类变量。对于定类变量,加减乘除等运算是没有实际意义的。 (2) Ordinal Data定序变量:变量的值不仅能够代表事物的分类,还能代表事物按某种特性的排序,这样的变量叫定序变量。问卷的人口特征中最常使用的问题“教育程度“,以及态度量表题目等都是定序变量,定序变量的值之间可以比较大小,或者有强弱顺序,但两个值的差一般没有什么实际意义。 (3)Interval Data 定距变量:变量的值之间可以比较大小,两个值的差有实际意义,这样的变量叫定距变量。有时问卷在调查被访者的“年龄”和“每月平均收入”,都是定距变量。 (4) Ratio Data 定比变量, 有绝对0点,如质量,高度。定比变量与定距变量在市场调查中一般不加以区分,它们的差别在于,定距变量取值为“0”时,不表示“没有”,仅仅是取值为0。定比变量取值为“0”时,则表示“没有”。 * * z分数(z-score),也叫标准分数(standard score)是一个分数与平均数的差再除以标准差的过程. z分数可以回答这样一个问题:一个给定分数距离平均数多少个标准差?在平均数之上的分数会得到一个正的标准分数,在平均数之下的分数会得到一个负的标准分数。 z分数是一种可以看出某分数在分布中相对位置的方法。z分数能够真实的反应一个分数距离平均数的相对标准距离。如果我们把每一个分数都抓换成z分数,那么每一个z分数会以标准差为单位表示一个具体分数到平均数的距离或离差。 与常用的其它统计检验方法相比,柯斯二氏检验方法具有功效高、计算简单、不需要人为分组、不受样本容量大小限制等优点,是一种可用于正态检验的较为理想的方法。 在统计学中,柯尔莫可洛夫-斯米洛夫检验基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。 Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n时所对应的系数αi,根据特定公式计算出检验统计量W。最后查特定的正态性W检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布。 Shapiro-Wilk检验,小样本使用的正态性检验 * 定类变量、定序变量、定距变量,定比变量: 定类变量:是指变量的取值即变量值只有类别属性之分,而没有大小、优劣之别。 定序变量:是指变量的取值,即变量值,除了有类别属性之分外,还有等级或次序的区别。 定距变量:是指变量的取值即变量值,除了具有类别、次序区别之外,还有类别之间、序列之间的标准化距离的变量。 定比变量:是指变量的取值,即变量值除具有定类、定序、定距等特征外,在变量取值中还有一个真正的零的变量即为定比变量。 * 用Pearsons卡方统计量进行统计检验时应注意的问题: 列联表的卡方检验用于检验两个分类变量的关联程度。卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma检验比用卡方检验更好。 * 四、探索性分析 通过茎叶图(Stem-and-Leaf Plots)描述频度分布 茎叶图由数字构成,表达变量的频数分布。 Analyze →Descriptive Statistics →Explore… 例如,语文成绩茎叶图。 通过箱图(Boxplots)描述数据分布 箱图也称为箱线图(箱式图),显示了变量数据的中位数、25%百分位数和75%百分位数,并给出偏离总体分布的奇异个案和极端个案。 四、探索性分析 通过箱图(Boxplots)描述数据分布 语文成绩箱图 四、探索性分析 通过箱图(Boxplots)描述数据分布并寻找异常值

文档评论(0)

2299972 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档