- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章SPSS数据的预处理精要.ppt
3-1 数据排序 3-2 变量计算 五、变量计算的应用举例 五、变量计算的应用举例 3-3 数据选取 三、数据选取的应用举例 三、数据选取的应用举例 三、数据选取的应用举例 3-4 计数 三、计数的应用举例 三、计数的应用举例 3-5 分类汇总 二、分类汇总的应用举例 二、分类汇总的应用举例 3-6 数据分组 三、数据分组的应用举例 3-7数据预处理的其他功能 三、数据拆分 四、SPSS缺失值处理 利用住房状况调查.sav,分析被调查家庭的人均住房面积的分布特征。 SPSS组距分组的基本操作步骤如下: (1)选择菜单 转换 - 重新编码为不同变量 (2)将分组变量选择到 数字变量 - 输出变量 框中。 (3)在输出变量框中的名称后输入存放分组结果的变量名,并单击更改按钮。 (4)在旧值和新值按钮进行分组区间定义。 要了解其分布特征应首先进行分组,可对“人均面积”变量进行组距分组。先利用数据排序功能对“人均面积”进行排序,得到最大值和最小值。根据理论应将数据大致分为12组,但处于实际问题的研究需要,姑且将数据分为4组。 (5)如果仅对符合一定条件的个案分组,则按如果按钮并输入SPSS条件表达式。否则,本步略。 分组注意: 在定义分组区间应注意遵循“不重不漏”的原则。“不重”是指一个变量值只能分在一个组中,不能在其他组中重复出现;“不漏”是指所有数据都应分配在某个组中,不能遗漏。(用加小数位避免此现象) 除上述数据预处理功能外,SPSS还提供了一些其他辅助处理功能,包括数据转置、加权处理、缺失值处理、变量集等。 一、数据转置 SPSS的数据转置就是将数据编辑窗口中数据的行列互换。 例 对职工数据.sav转置 SPSS数据转置的基本操作步骤如下: (1)选择菜单: 数据 - 转置 (2)指定数据转置后应保留哪些变量,将它们选入变量框中。未被选中的变量将在新文件中缺失。 (3)指定转置后数据文件中各变量如何取名。应选择一个取值惟一的变量作为标记变量到名称变量框中。转置后数据各变量取名为:K_001,K_002,K_003。如果略去本步,则转置后数据各变量名默认为V001,V002,V003。 SPSS还会自动产生一个名为Case_LBL的新变量,用来存放原数据文件中的各变量名。 二、加权处理 统计分析中的加权处理是极为常见的,如计算加权平均数等。 例如,希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理,还应考虑到销售量对平均价格的影响。因此,以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数,就能够较准确地反应平均价格水平。数据文件名为“蔬菜销售.sav”。 SPSS中指定加权变量的操作步骤是: (1)选择菜单 数据 - 加权个案 (2)选择加权个案选项,并将某变量作为加权变量选到频率变量框中。 加权操作完毕后,数据编辑窗口中的数据并没有变化,而仅在状态栏中有已经加权的提示信息(加权范围)。 一旦指定了加权变量,那么以后的分析处理中加权是一直有效的,直到取消加权为止。取消加权应选择请勿对个案加权选项。 职工数据.sav SPSS的数据拆分与数据排序很相似,但有一个重要的不同点,即数据拆分不仅是按指定变量进行简单排序,更重要的是根据变量对数据进行分组,为以后的分组统计分析提供便利。 1、SPSS数据拆分的基本操作步骤 (1)选择菜单 数据 - 拆分文件 (2)将拆分变量选到比较组框中 (3)拆分会使后面的分组统计产生两种不同格式的结果。 (4)如果数据编辑窗口中的数据已经事先按所指定的拆分变量进行了排序,则可以选择文件已排序项,可以提高拆分执行的速度;否则,选择按分组变量排序文件项。 2、说明: (1)数据拆分将对后面的分析一直起作用,即无论进行哪种统计分析,都将按拆分变量的不同组别分别分析计算。如果希望对所有数据进行整体分析,则需要重新执行数据拆分,在数据拆分窗口中选择分析所有个案,不创建组项。 (2)对数据可以进行多重拆分,类似数据的多重排序。多重拆分的次序决定于选择拆分变量的前后次序。 (3)数据拆分操作完毕后,数据编辑窗口中的数据并没有变化,而仅在状态栏中有拆分的提示信息(拆分条件×××)。 大量的缺失值会给数据分析带来极大的影响,这就需要采用科学的方法对缺失值进行插补。 操作步骤如下: (1)选择菜单 转换 - 替换缺失值 (2)将需要插补的变量单击按钮送到新变量框中,
文档评论(0)