- 1、本文档共65页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ppt第3章数据的预处理解读
第三章 SPSS数据的预处理 为什么要进行数据的预处理 在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。 数据的预加工处理服务于数据分析和建模,主要包括以下几个问题: 预处理的内容 数据的排序 变量计算 数据选取 计数 分类汇总 数据分组 数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。 3.1 数据的排序 SPSS的数据排序是将数据编辑窗口中的数据按照某个或多个指定变量的变量值升序或降序重新排列。这里的变量也称为排序变量。排序变量只有一个时,排序称为单值排序。排序变量有多个时,排序称为多重排序。多重排序中,第一个指定的排序变量称为主排序变量,其他依次指定的变量分别称为第二排序变量、第三排序变量等。 3.1.1数据排序的作用 数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等; 通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度; 通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。 3.1.2 数据排序的基本操作 SPSS数据排序的基本操作步骤 (1)选择菜单数据-排序个案 (2)将主排序变量从左边的列表中选到“排序依据”框中,并在“排列顺序”框中选择按该变量的升序还是降序排序。 (3)如果是多重排序,还要一次指定第二、第三排序变量及相应的排序规则。 说明 1、数据排序是整行数据排序,而不是只对某列变量排序; 2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序; 3、数据排序后,原有数据的排序次序必然被打乱。 3.2 变量计算 数据的转换处理是在原有数据的基础上,计算产生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有效的特点。 3.2.1 变量计算的目的 SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。 (1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。 (2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。 在变量计算过程中涉及到几个概念:SPSS算数表达式、SPSS条件表达式和SPSS函数。 3.2.2 SPSS算术表达式 指出按照什么方法计算变量; SPSS算术表达式是由常量、变量、算术运算符、圆括号、函数等组成的式子。 字符型常量应当用引号括起来 变量是指那些已存在于数据编辑窗口中的原有变量 算术运算符主要包括+、-、*、/、**(乘方) 在同一算术表达式中的常量及变量,数据类型应该一致,否则无法计算 3.2.3 SPSS条件表达式 在变量计算中通常要求对不同的个案分别按照不同的方法进行计算,于是就需要通过一定的方式来指定个案; SPSS条件表达式是一个对条件进行判断的式子。其结果有两种取值:如果判断条件成立,则结果为真;如果判断条件不成立,则结果为假。条件表达式包括简单条件表达式和复合条件表达式。 (1)简单条件表达式 由关系运算符、常量、变量以及算术表达式等组成的式子。其中关系运算符包括、、=、~=(不等于)、=、=。(nl35) (2)复合条件表达式 又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。其中,逻辑运算符号包括或AND(并且)、|或OR(或者)、~或NOT(非)。NOT的运算优先级最高,其次是AND,最低是OR。可以通过圆括号改变运算的优先级。(nl=35)and not (zc3) 3.2.4 SPSS函数 SPSS函数是事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。这些程序都有各自的名字称为函数名。执行这些程序段得到的计算结果称为函数值。 函数书写的具体形式为:函数名(参数) 其中,函数名是SPSS已经规定好的,参数可以是常量(字符型常量应用引号括起来),也可以是变量或算术表达式。参数可能是一个,也可能是多个,各参数之间用逗号分隔。 SPSS函数大致可以分成八大类:算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。 3.2.5 变量计算的基本操作 (1)选择菜单转换-计算变量,弹出“计算变量”对话框如下: (2)在“目标变量”框中输入存放计算结果
您可能关注的文档
- PhotoShop抠图技巧大总结.doc
- 80、90后员工职业心态.ppt
- poct质控管理.ppt
- PMC黄金版(生产计划与物料控制).ppt
- POLYCOM RMX2000操作手册.ppt
- 863-制冷压缩机检测技术说课课件.ppt
- 801社会主义核心价值观主题班会ppt.ppt
- PICC完整培训内容.ppt
- 8PCR基因扩增仪.ppt
- PowerPoint2016使用技巧.ppt
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
文档评论(0)