对变量值进行分组或合并recode.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对变量值进行分组或合并recode

实习3 数据管理(一) 数据管理:对数据文件的结构进行重新调整或转换,以便适合于相应的统计方法。 数据管理包括的内容:计算新变量、变量取值重新编码、变量值排序、文件合并、文件拆分等。 数据管理有两个级别: 变量级别(Transform菜单即“转换”菜单) 文件级别(Data菜单即“数据”菜单) 学习目标(1) 利用“Compute”(计算变量)计算新变量 利用“Recode”(重新编码)对变量值进行分组 利用“Visual Bander”(可视离散化)对连续型变量进行可视化分组 利用“Automatic Record”(自动重新编码)将字符变量转化成数值变量 利用“Rank Cases”(个案排秩)计算秩次 学习目标(2) 利用“Sort Cases”(排序个案)进行排序 利用“Split File”(拆分文件)进行记录拆分 利用“Select Cases”(选择个案)进行记录筛选 利用“Weight Cases”(加权个案)进行记录加权 利用“Aggregate”(分类汇总)进行分类汇总 主要内容 3.1 变量级别的数据管理 3.2 文件级别的数据管理(一) 3.1 变量级别的数据管理 功能特点(1) 主要通过Transform菜单(“转换”菜单)对变量进行操作,包括:对变量进行四则运算生成新变量、记录的排秩、对数据重新编码等。这些都是对数据进行统计分析的预处理。 功能特点(2) 计算变量(Compute):最常用和重要的过程。 变量转换:包括Recode(重新编码)、Visual Bander(可视离散化)、Count(计数)、Rank Cases(排秩个案)、Automatic Recode(自动重新编码)这五个过程。 实际上都可以被看成是compute过程在某一方面功能的强化和打包。 计算变量:Compute 功能:用于计算新变量,或者给老变量赋值。 三个概念:SPSS算术表达式、SPSS函数、SPSS条件表达式。 实例:transforme.sav是某年级学生数学、英语、语文三门成绩的数据文件,现在统计英语成绩在60分以上的学生的语文和数学的平均成绩。 对变量值进行分组或合并:Recode(1) Recode过程: Recode into same variable Recode into different variable(“重新编码为不同变量”,较常用) 对连续型变量进行分组(注意组边界取值) 在transform.sav中生成新变量grade,当英语成绩小于60时取值为“不及格”,大于等于60且小于70为“及格”,大于等于70且小于80为“良好”,大于等于80为优秀。 组边界值归为哪个类别?“先下手为强” 对变量值进行分组或合并:Recode(2) 分类变量类别的合并 将transform.sav中产生的变量grade中的“优秀”、“良好”和“及格”三个等级合并为一个等级“PASS”,将“不及格”转化为“NOPASS”。 连续变量的可视离散化:Visual Bander 功能:相比Recode,分组更有规律,可对变量值进行等距分组、等样本量分组等。 三种分组方式: 等距分组:transform.sav中,数学成绩60分以下为一组,60分以上按间距为10进行等距分组。 等比例(等样本量)分组 按标准差范围分组(可用来筛选异常值) 字符变量转换为数值变量: Automatic Record 功能:将字符型变量自动按原变量值的大小或者字母排序生成新变量,其值就是原值的大小次序。 在transform.sav数据中,将字符型变量city转化为数值型变量newcity。 (k)昆明:3 (b)北京:1 (s)上海:4 (c)长春:2 计算变量秩次:Rank Cases 功能:给变量值排序,给出序号。 结点:相同的观测值形成一个结点。 在结点处秩次的处理方法: 都取最小秩次 都取最大秩次 都取平均秩次 当做一个记录处理 对个案内的值计数:Count 功能:统计每个个案内满足条件的变量数。 如计算每位学生的优秀科目数。 3.2 文件级别的数据管理(一) 功能特点 对数据进行加工整理,例如根据统计分析的要求对数据进行分组、合并、加权、筛选等操作 简单命令:不学也会。插入变量、插入记录等。 常用简单过程:好学,而且非常重要。排序、拆分文件、选择记录、加权记录等。 专用过程:难学,用途比较特殊 记录排序:Sort Cases 功能: 将记录按一个或多个变量值的升序或降序排列,有利于进行查找、修改等操作。 将某个变量按升序或降序排列,可以方便用户了解数据,进行数据分析。 缺失值在排序中会排在最小值的前面,可以通过排序的

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档