网站大量收购独家精品文档,联系QQ:2885784924

SPSS数据的预处理.pptVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 SPSS数据的预处理 3.1 数据的排序  3.2 变量计算 3.3 数据选取 3.4 计数 3.5 分类汇总 3.6 数据分组 3.7 数据预处理的其他功能   3.1 数据的排序 根据某些变量值重新排列各观测量在数据文件中出现的先后顺序,如:按高矮排队、按成绩排名等。 数据排序的目的: 数据排序在数据分析过程中有很重要的作用: 便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等。 找到数据的最大值和最小值,进而可以计算出数据的全距(极差 Range),初步把握和比较数据的离散程度。 快捷的发现数据的异常值,为进一步明确它们是否对分析产生重要影响等提供帮助。 数据排序步骤 1。打开数据文件 2。选择Data-Sort Case a. 选择Sort by变量 b. 升序或降序 3。选择排序变量 4。选择排序方式 5。击OK 数据排序实验 数据排序的应用举例 以“住房状况调查.sav”为例,通过数据排序功能分析本市户口和外地户口家庭的住房面积情况。 结果解释: 本市户口家庭住房面积的最小值为6平方米,最大值为300平方米;外地户口家庭住房面积的最小值为7平方米,最大值为168平方米。可见,在最小值上,本市户口和外地户口家庭差距很小,但在最大值上却有较大差距,而且从全距角度看,本市户口不同家庭间的住房面积差距比外地户口要大许多。 数据排序实验 实验内容:案例3-1。打开数据文件“3.1职工数据.sav”,以职称为主排序变量的降序,基本工资为第二排序变量的升序进行多重排序。详细写出SPSS具体操作过程及分析结论。 3.2 变量计算 变量计算目的 数据的转换处理 对数据的原有分布状态进行转换 几个概念 SPSS算术表达式 SPSS条件表达式 SPSS函数 步骤 1。读数据文件 2。选Transform-compute 3。确定目标变量 4。确定目标变量的数值表达式 5。按OK 例:现有某班的5门功课期末考试成绩。为了进一步的分析,需要先对数据进行整理,要求算出5门功课的总分、平均分、加权总分(语文、数学的权重为1.2,物理、化学的权重为1.0,生物的权重为0.7)。 1、建立数据文件“3.2test.sav”,变量名为no(学号)、chinese(语文)、math(数学)、physics(物理)、chemist(化学)、biology(生物)。 2、选择[Transform] →[Compute],打开Computing Variable(计算变量)主对话框,见图。 3、在Target Variable(目标变量)框中,输入变量名score。 4、单击[TypeLabel],打开Compute Variable: Type and Label(计算变量:类型与标识)对话框,见图。在此可设定目标变量的变量标识( Label )与变量类型( Type )。 Label(变量标识) (1) Label(标识),由用户自行录入标识名称,本例为“总分”。 (2)Use expression as label(使用表达式作为标识)。 Type(变量类型),可选择Numeric(数值型)或String(字符串)。 5、在Numeric Expression(数值表达式)框输入表达式: SUM(chinese,math,physics,chemist,biology) 或者chinese+math+physics+chemist+biology 6、单击[OK],即可生成一个新变量(score)。 同样的操作,我们还可计算出平均分与加权总分,有关设置如下: 变量1:平均分 目标变量1:Mean 标识1:平均分 数值表达式1:MEAN(chinese,math,physics,chemist,biology) 变量2:加权总分 目标变量2:W_score 标识2:加权总分 数值表达式2:chinese*1.2+math*1.2+physics+chemist+biology*0.7 例:为了便于对某市儿童死亡资料(age_com.sav)进行进一步的分析,先根据出生日期(bdate)及死亡日期(ddate)对该数据按如下要求进行分组。(见下一页表) 年龄的分组要求及值标识 打开文件“3.2age_com.sav”。 选择选择[Transform] →[Compute],打开Computing Variable(计算变量)主对话框。 在Target Variable(目标变量)框中,输入变量名group。 单击[TypeLabel],打开Compute Variable: Type and Label(计算变量:类型与标识)对话框,在此对话框中设定变量标识( Label )为死亡分组。 在Numeric Expr

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档