SPSS软件数据管理.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS的基本数据管理功能 何平平 北大医学部流行病与卫生统计学系 Tel(SPSS13.0) 一、数据获取 二、变量属性 三、记录排序 四、文件拆分 五、筛选记录 六、通过计算产生新变量 七、重新赋值 一、数据获取 Getting Data into SPSS 读取SPSS数据文件:*.sav , 常用的其他外部数据文件: *.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb …… 注意:医学领域常用数据库EpiData软件,先将数据文件*.rec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav 文件。 数据获取途径 二、变量属性 Variable Properties 1.Name:变量名。允许用中文,但习惯上采用英文变量名。 2.Type:变量类型,常用数值型(Numeric)、字符型(String)、日期型(Date)。 3.Width:变量宽度,默认为8。 4.Decimals:小数位数,默认为2。 5.Label:变量编码,又称为变量标签,用于注释变量名的含义。 6.Values:变量值编码,又称为变量值标签,用于注释变量值的含义。例如:变量sex,变量标签为“性别”;变量值为1与2,变量值编码:1为“男性”,2为“女性”。 7.Missing:缺失值。默认为系统缺失值,用“.”表示。 8.Columns:列宽,默认为8。 9.Align:对齐方式。数值型变量默认右对齐(Right),字符型变量默认左对齐(Left) 。 10.Measure:测度,包括三类:数值变量(Scale),名义变量或无序分类变量(Nominal),有序分类变量或等级变量(Ordinal)。 数据清单 变量清单 数据文件ex.sav(数据窗口……数据清单界面) 数据文件ex.sav(数据窗口……变量清单界面) 注意:一行对应一个“记录(Case)”;一列对应一个“变量(Variable)”。此数据窗口不是一个很好的数据录入界面。 三、记录排序 Sort Cases ex .sav文件中, 按照“height(身高)”的大小排序。 升序 降序 四、文件拆分 Split File 比较组 分组变量 根据分组变量排序 ex .sav文件中, 按照“sex(性别)”拆分文件 分性别对“height(身高)”进行统计描述 描述性统计 不同性别的“height(身高)”统计描述 所有记录的“height(身高)”统计描述 注意:SPSS的输出结果文件为*.spo 五、筛选记录 Select Cases 如果条件满足 过滤 删除 select unselect 筛选条件:有高血压家族史(genic 0) 如果选用Deleted,则一定要将筛选后的文件另存一个文件名 filter_$变量,0表示未选中该记录,1表示选中该记录 不符合条件的记录,被用斜线筛除 有高血压家族史的患者身高的统计描述 所有患者身高的统计描述 六、通过计算产生新变量 compute 产生一个新变量:bmi=体重/(身高**2),四舍五入取整 七、重新赋值 Recode…….. Into different variables 旧及新的变量值 根据bmi对7个记录进行分组,bmi: 正常:18-23;超重:24-27;肥胖:=28。 定义新的变量名:bmi _ gr

文档评论(0)

xiexie2012 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档