- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据录入与数据获取2-2013讲述
数据编辑窗口常用操作技巧 和其他常用软件相比,SPSS数据界面最大的优势就是支持鼠标的拖放操作,以及复制、粘贴等命令。 常用技巧: (1)连续输入多个相同值(掌握) (2)快速定义成批变量(了解) (3)将Excel或Word中的数据直接导入SPSS(掌握) 数据编辑窗口常用操作技巧 (4)快速改变变量排列次序(掌握) (5)快速定位记录(了解) (6)利用排序功能迅速查找异常值、极端值(了解) 数据编辑窗口常用操作技巧 (7)利用变量值标签检查录入错误(了解) (8)冻结行或列(了解) (9)快速重复调用对话框(了解) (10)从其他窗口中快速换回数据窗口(了解) 数据录入与数据获取 数据是统计的基础,用于分析的数据资料可以是原始资料,需将它们录入SPSS,建立数据文件;另一种是已经被录入其他数据格式的资料,需要将其内容直接读入SPSS中。 一、数据格式 1、统计软件中数据录入格式的基本原则 不同观察对象的数据不能在同一条记录中出现,即同一观察数据独占一行 每一观察指标或影响因素只能占一列,即同一指标录到同一变量中去 最终数据集应包含所有原始数据的信息 2、变量属性介绍 1)数据录入三步曲: 定义变量名,给每个变量起名,已突破8个字符的限制,最多可达64个字符,但为了与其他软件能进行有效数据通讯,建议用英文或加数字,且以8字符为限 指定变量属性,指定每个指标的统计特性,如变量类型、宽度、小数位数等。 录入数据,把每个记录的各指标录入为电子格式 定义变量名应遵循的原则如下: (1)首字符必需是英文或汉字,不能以下划线“_”或圆点“.”结尾。 (2)变量名不能使用SPSS的保留字有ALL、AND 、BY 、OR 、NOT 、EQ 、GE 、GT 、LE 、LT 、NE 、TO 、WITH (3变量名中不能有空格或某些特殊符号,如“!” 、“?”和“*” (4)系统中不区分变量名中的大小写字符。 (5)变量名称最好以能够代表该数据意义的文字来命名,如此提高变量的可读性。如可以使用staffno来代表职员代号的变量名称,比使用no来表示更清楚明了。 2)变量的存储类型type 数值型:标准数值型numeric、逗号数值型comma、圆点数值型dot、科学记数法型scientific notation、美元数值型dollar、用户自定义型custom currency(六种) 字符型:默认显示8个字符位,区分大小写,不能进行数学运算,在数据处理过程中用引号引起来,但录入时不加引号 日期型:系统给出多种显示方式,但存储的是该时间与1582年10月14日零点相差的秒数,故早于该时间无效 3)变量的测量尺度measurement 统计学中的分类 定类尺度nominal(无序分类)可以是数值型,也可以是符型变量。 定序尺度ordinal(有序分类)可以是数值型,也可以是符型变量。 定距尺度interval(连续性变量):是对事物类别或次序之间间距的测度,只能进行加减运算,没有绝对的0,即0并不表示没有,如温度 定比尺度scale (连续性变量):能够测算两个测度值之间的比值,有绝对0,可进行加减乘除运算 SPSS将后两者合并为scale 4)变量名与变量值的标签 label用于对变量名的进一步解释,标签会在结果中输出,方便阅读 Value labels:对变量取值含义的解释说明,对定序和定类变量不可少,分析结果以相应的标签出现,data view中,view ?value labels,显示结果,且可检查有无数据录入错误 值标签 5)缺损值missing value 系统缺失值:数值型为圆点“.”,字符型是空字符串,录入时跳跃亦为此 用户自定义:如调查表中的9,99等表示不知道或拒绝回答,此时应将该值定义为缺失值。 用户自定义有三种定义方式可选:无,三个离散值discrete missing value, 范围加一个离散值range plus optional discrete miss 缺失值 角色 - 输入:变量将用作输入(例如预测变量、自变量)。 目标:变量将用作输出或目标(例如因变量)。 两者:变量将同时用作输入和输出。 无:变量没有角色分配。 分区:变量用于将数据划分为单独的训练、检验和验证样本。 拆分:设定此角色是为与SPSS Modeler 相互兼容,具有此角色的变量不会在SPSS Statistics 中用作拆分文件变量。 二、数据的直接录入 1、操作界面 打开系统会生成空的数据文件 两个界面:data view, variable view 定义完变量后,可直接在数据视图页面输入数据 2、开放题和简单单选题的录入 即可采用:字符直接录入 字符代码
文档评论(0)