- 1、本文档共49页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据转换(Transform) Compute 计算产生变量 数据转换(Transform) Compute —— 利用函数进行计算 描述性统计分析 1统计量介绍 2频数分析 3描述统计量 4数据探索 5比率统计分析 SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。 本节课主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。 基本统计量介绍 集中趋势 均值(Mean) 中位数(Median) 众数(Mode) 百分数(四分位数Quartiles等) 离散趋势 样本方差(Variance) 样本标准差(Std.deviation) 均值标准差(Stand Error of Mean) 极差(Range) 分布形态 偏度(Skewness) 峰度(Kutosis) 定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为 频数分析 频数分析目的和主要功能 频数就是一个变量在各个变量值上取值的个案数,基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 例如,调查消费者拥有数码产品的数量,首先分析受访者的总人数、家庭收入情况、受教育程度、性别等,获取样本是否具有总体代表性、抽样是否存在系统偏差等信息。这些可以通过频数分析来实现,经过频数分析可以得到如下结果: (1)频数分布表:该表中包含频数、各频数占总样本数的百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频数分析中提供的统计图形可以是条形图、饼图或者直方图。 新建数据库或打开已有数据库 频数分析过程的操作界面 (1)候选变量框 列出数据文件中所有的变量 (2)Variables框 从候选变量框中选择要分析的变量 移入此框中,可同时选择多个变量, 此时,SPSS就将分别产生多张 频数表或统计图形。 (3)Display frequency tables复选框 此复选框设置是否显示频数表, 系统默认选中,表示要显示频数表。 频数分析过程的操作界面 (4)Statistics按钮 单击该按钮会弹出新的对话框, 该对话框主要用于确定将要在 输出结果中出现的统计量, 选中统计量前的复选框表示 输出该统计量。 (5)Charts按钮 用于确定将输出的图形类型 和图形取值。 (6)Format按钮 定义输出频数表的格式 频数分析 例:测量100名健康成人的血清蛋白总含量,形成数据serum(克/升),使用频数分析了解这一数据的统计特征。 该教学案例数据解析 均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 计算公式如下。 中值是在一组数据中居于中间的数(特别注意的地方是:这组数据之前已经经过升序排列!!!),即在这组数据中,有一半的数据比它大,有一半的数据比它小。如果这组数据包含偶数个数字,中值是位于中间的两个数的平均值。 10 20 40 50 70 10 20 30 40 50 60 百分位数分析:比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。 众数(Mode)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。 修正定义:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用M表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。 /view/170875.htm 定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值-最小值。 4.3 描述性分析 描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频数分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准正态评
文档评论(0)