《管理统计学实验教程》第7章SPSS数据文件的建立与预处理.ppt

《管理统计学实验教程》第7章SPSS数据文件的建立与预处理.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验7-1 一次抽样调查的数据如data7-1.sav所示,定义的各变量及其主要属性如下表7.3所示。 第1步 变量定义 第2步 录入数据文件 第3步 从其他数据文件导入数据建立数据文件 选择菜单“文件→打开→数据”,弹出“打开文件”对话框,左键单击“文件类型”,即可看到SPSS所能打开的数据文件类型 1、数据文件的合并 SPSS可以对多个数据文件进行合并,合并方式有两种:对个案的合并和对变量的合并。 (1)对个案的合并。对观测量的合并要求两个数据文件至少有一对属性相同的变量,而变量名称可以有所不同。 (2)对变量的合并,则不需要两个文件有相同变量。 2、数据文件的拆分 在进行数据分析的时候,有时需要对数据文件进行拆分。数据文件的拆分,是将原始数据进行重新排序,使得某一选定变量取值相同的个案集中排列在一起。在进行统计分析时,经常要对文件中的观测进行分组,然后按组分别进行分析。 3、数据的选取 数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。 SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取,这样后面的分析操作就只针对选出的数据,直到用户取消这种选取为止。 4、数据的加权 权重是统计学里的重要概念之一。在记录有大量数据的文件里,可能多次测量到同一观测量值,所谓权重是指同一个观测量值在所有的观测量里出现的次数或频率。 实验7-2-1 将数据文件data7-2和data7-3、data7-2和data7-4进行合并。 实验2.1 数据文件的合并 第1步 打开“合并文件→添加个案”对话框。 打开数据文件数据文件data7-2和data7-3,选择菜单“数据→合并文件→添加个案” 第2步 选择需添加的观测值 第3步 打开“合并文件→添加变量”对话框 打开data7-2和data7-4,选择菜单“数据→合并文件→添加变量” 第4步 选择需添加的变量 实验 2.2 数据文件的拆分 将数据文件data7-5按所属地区进行分组。 第1步 拆分文件的设置 打开数据data7-5,选择菜单“数据→拆分文件”,出现如图所示对话框。该对话框提供了3种方式:“分析所有个案,不创建组”对全部观测进行分析,不进行拆分;“比较组”在输出结果种将各组的分析结果放在一起进行比较;“按组织输出”按组排列输出结果,即单独显示每一分组的分析结果。 第2步 选择拆分方式 按照所属地区拆分文件,选择“比较组”,激活“分组方式”栏,选中“所属地区”变量移入其中。 实验 2.3 数据的选取 对数据文件data7-5的数据,只选取地区生产总值大于50000亿元的省份。 第1步 数据组织。 第2步 打开“选择个案”对话框。 选择“数据→选择个案”命令 第3步 指定选择个案的方式 系统提供了几种选择观测量的方法,有以下几种: (1)所有个案:所有的个案都选择。该选项可用于解除原来的个案选择。 (2)如果条件满足:按指定条件选择个案。 SPSS要求用户以条件表达式给出数据选取的条件,SPSS将自动对数据编辑窗口中的所有个案进行条件判断。那些满足条件的个案,即条件判断为真的个案将被自动选取出来,而那些条件判断为假的个案则不被选中。 (3)随机个案样本:即对数据编辑窗口中的所有个案进行随机筛选,包括如下两种方式: 第一,近似抽样 近似抽样要求用户给出一个百分比数值,SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案。 第二,精确抽样 精确抽样要求用户给出两个参数。第一个参数是希望选取的个案数,第二个参数是指定在前几个个案中选取。SPSS自动在数据编辑窗口的前若干个个案中随机精确地抽出相应个数的个案来。 (4)基于时间或个案全距:即选取数据编辑窗口中样本号在指定范围内的所有个案,要求给出这个范围的上、下界个案号码。 (5)使用过滤变量:即依据过滤变量的取值进行样本选取。要求指定一个变量作为过滤变量,变量值为非0或非系统缺失值的个案将被选中。这种方法通常用于排除包含系统缺失值的个案。 第4步 设置选中个案的输出形式 各输出形式的含义如下: (1)“过滤掉未选定的个案”表示在未被选中的个案号码上打一个“/”标记,在当前数据文件中自动生成一个名为filter_$的新变量,取值为0或1,1表示个案被选中,0表示未被选中。 (2)“将选定个案复制到新数据集”表示将选中的个案输出到新的数据文件中,设置新数据文件的文件名即可。 (3)“删除未选定个案”表示将未被选中的个案从数据编辑窗口中删除。 第5步 设置选择个案的条件 单击“选择”中的“如果条件满足”选项,单击“如果”按钮,弹出如图所

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档