第3章变量级别的数据管理.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章变量级别的数据管理

第3章 变量级别的数据管理 2013.9 数据管理:对数据进行加工处理。对同一个数据需进行不同侧面的研究,可采取多种统计方法,不同的统计方法对数据文件结构的要求不同,这需要对数据文件的结构进行重新调整或转换,以便适用于相应的统计方法。数据管理直接关系到数据分析的结果。 数据文件的管理功能集中于: “转换”(Transform)菜单——变量级别管理 “数据”(Data)菜单——文件级别管理 “转换”(Transform)菜单的项目分 为几类: 计算新变量:“计算变量”(Compute)过程; 变量转换: “重新编码”(Recode) “离散化”(Visual Bander) “计数”(Count) “个案排秩”(Rank Cases) “自动重新编码”(Automatic Recode) 专用过程: 日期/时间(Date/ Time ) 创建时间序列(Create Time Series) 替换缺失值(Replace Missing Values) 随机数字生成器(Random Number Seed) 运行挂起的转换(Run Pending Transforms) 3.1 变量赋值 所谓变量赋值是指在原有数据的基础上,根据用户的要求,使用SPSS算术表达式及函数,对所有记录或满足条件表达式的某些记录进行四则运算,并将结果存入一个用户指定的变量中。该变量可以是一个新变量,也可以是一个已经存在的变量。 3.1.1常用基本概念 1.算术表达式(Numeric Expression),用于进行变量转换,是由常量、变量名、算术运算符、圆括号等组成的式子。 2.函数,有70余种系统函数,分为8类,包括算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数。函数名(参数)是函数具体的书写形式,系统已经规定好的;圆括号中的参数可是一个或多个(多个参数之间用单字符逗号隔开);参数类型:常量、变量、算术表达式。 3.条件表达式和逻辑表达式,是对指定部分记录进行计算和逻辑运算。 如果上述三者同时出现,要先满足条件后计算。 3.1.2 “计算变量”过程 “计算变量” (Compute) 利用算术符号和函数生成新结果, 结果保存到指定变量中,指定变量可 以是新变量,也可以是一个已存在的 变量。 例3.1 将年龄分为3组。 又例1 数据transform.sav 平均成绩=(语文成绩+数学成绩+英语成绩)/3 英语成绩在60分以上的学生语文和数学的平均成绩 又例2 调整后工资计算“个人”所得税。调整后工资额小于1200元,税为0;工资额在1200-1700之间,税为(调整后工资额-1200)×0.05;工资额在1700-3200元之间,税为(调整后工资额-1200) ×0.1-25;工资额在3200-6200元之间,税为(调整后工资额-1200) ×0.15-125。 又例3 辽宁样本家暴课题数据(部分)中,“出生年”变量计算为新变量“年龄”。 3. 2 对已有变量值的分组合并 重新编码(Recode) 连续变量转换为等级变量(分类变量或离散变量),如年龄、收入; 将数值型变量转换为字符型变量,将字符型变量转换为数值型变量; 将分类变量不同的变量等级进行合并,如教育程度; 重新编码为相同变量(Recode into Same Variable)和重新编码为不同变量(Recode into Different Variable )。 3.2.1 对连续变量进行分组合并 连续变量转换为离散变量(等级或定序变量),生成新变量值,新值可赋给原变量,可生成新变量。 通过两个过程实现:“重新编码”(Recode)和 “离散化分段”(Visual Bander) 例3.2 以例3.1运用“重新编码”过程操作。 又例 数据transform.sav 生成新变量grade。当英语成绩小于60分取值为“不及格”,60-70分为“及格”,70-80分为“良好”,大于等于80分为“优秀”。 3.2.2分类变量类别的合并 还以例3.1运用“重新编码”过程操作。 又例 数据transform.sav 生成新变量grade2,将grade中的优秀、良好和及格合并为“PASS”等级,将“不及格”转化为“NOPASS”。 3.3 连续变量的离散化 3.3.1 可视离散化过程 “可视离散化” (Visual Bander) SPSS12.0中新增的功能; 可以进行等距分组,或等样本量分组; 采用图形化的操作方式。 例3.2 将S3年龄变量等间距分为10组。 3.3

文档评论(0)

tiangou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档