网站大量收购闲置独家精品文档,联系QQ:2885784924

SPSS数据分析与挖掘实战案例精粹第四章.pptx

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS数据分析与挖掘实战案例精粹第四章.pptx

第四章 SPSS操作进阶第四章 SPSS操作进阶4.1案例背景4.2问卷的录入4.3问卷质量校验4.4问卷数据的分析4.5项目的总结与讨论4.1.1项目背景 互联网技术发展,网上购物盛行。我们的客户是做数码产品实体店的店主,想搭建一个购物网站。在搭建网站之前,需要对网站的建立进行详细规划,包括网购的产品种类、配送方式、支付方式等等,为了让网站更贴近顾客喜好,这就产生了调查问卷。让这个客户的实体店里的会员填写调查问卷。4.1.2分析思路对纸质调查问卷进行录入(4.2问卷的录入)对录入数据质量检验(4.3问卷质量校验)分析问卷,提出建议(4.4 问卷数据的分析) (4.5项目的总结与讨论)4.2.1开放题录入字符型变量不能参与运算,且区分大小写,一般作为记录的标识。宽度为该变量的长度,一个汉字两个宽度单位,一个字母或数字或小数点都是一个宽度单位4.2.2单选题录入(6)值:1代表“男”,2代表“女”。数据视图中录入性别的两种方式(1) 使用数字1,2来录入性别(2)选定工具栏的“显示值标签”,通过下拉框的方法来录入注释:当选择男或女时,实际在数据文件中保存的是数字1或2。4.2.3多选题录入对于多选题,每个被调查者可能会选择多项,无法用单一变量录入,则考虑用多个变量来结合定义。为什么无法使用单一变量录入?举例:你经常使用的有哪些信誉好的足球投注网站引擎是哪几个?A百度; B谷歌; C雅虎 ; D360; E其他你经常使用的有哪些信誉好的足球投注网站引擎是哪几个?ABABCADF字符型变量不能参与运算,不能统计A多少B多少数值型变量,使用值标签,只能多选一.sav数值型变量,使用值标签,只能多选一4.2.3多选题录入-多重响应多重响应:几个变量是一个多选题的选项,并设定一个变量名。有两大类:二分法和多重分类法。P52第一个受访者22岁,浏览器选了百度、360和其他。第二个受访者33岁,浏览器选了谷歌和其他二分类法:每个变量代表一个选项,每个选项具有两个可能值(1选中,0没选中)B4(年龄)B5(你经常使用的有哪些信誉好的足球投注网站引擎是哪几个?)B5_1(百度)B5_2(谷歌)B5_3(雅虎)B5_4(360)B5_5(其他)第一个受访者2210011第二个受访者3301001第一个受访者22岁,浏览器选了百度、360和其他。第二个受访者33岁,浏览器选了谷歌和其他多重分类法:受访者的答案代表一个变量,变量数少于或等于总选项数。(百度1谷歌2雅虎33604其他5)B4(年龄)B5(你经常使用的有哪些信誉好的足球投注网站引擎是哪几个?)B5_1(第一个答案)B5_2(第二个答案)B5_3(第三个答案)B5_4(四)B5_5(五)第一个受访者22145第二个受访者3325当选项少时,两者皆可当选项多,答案少的时候,选择多重分类法是比较轻松的实操:录入二分类中代表每个选项的变量,在录入时应该保持一致多重分类中代表每个答案的变量,在录入时应该保持一致请问您目前已经拥有的数码产品有哪些?.sav请问请问您目前已经拥有的数码产品有哪些?.sav您目前已经拥有的数码产品有哪些?二分法、计数值1选中为1,没选中为0,把数值为1的计数一下,即统计选中情况。请问你未来打算优先购买的数码产品有哪些最多选三项.sav请问你未来打算优先购买的数码产品有哪些?请问你未来打算优先购买的数码产品有哪些最多选三项.sav(请问你未来打算优先购买的数码产品有哪些最多选三项.sav最多选三项请问你未来打算优先购买的数码产品有哪些最多选三项.sav)表示这里使用多重分类法4.3.1去除重复记录该变量取值相同则为重复数据一组变量的取值全相同则为重复数据问卷录入数据.sav在匹配组内的排序标准框中定义排序顺序,便于在查找出来的多条重复记录中指定主个案和重复个案。2-11重复数据.sav把定义匹配个案的依据设为第一顺序,把在匹配组内的排序标准设为第二顺序2-11重复数据.sav。 基本个案指示符中基本个案用1表示,重复个案用0表示。 每组中最后一个个案为基本个案:同一重复数据组的最后一例是主要数据,其他是重复数据。 每组中的第一个个案为基本个案:同一重复数据组的第一例是主要数据,其他是重复数据。 根据指示符(新变量)的值进行筛选:0过滤,1保留 连续计算每个组合中匹配个案(0=非匹配个案):同一重复数据组中包括基本个案和重复个案组内编号,0表示没有重复数据2-11重复数据.sav。显示已创建变量的显示频率,是根据基本个案指示符(基本个案1表示,重复个案0表示)中1和0的个数来进行统计描述的。4.3.2发现异常值问卷录入数据.sav.可以在缺失值中,离散缺失值3和7在选择个案中过滤掉未选定个案4.3.3逻辑校验B3:您是否有过网上购物的经历?B4:您平均每月网络购物的消费额大致是?B5:您在网上购物时采用什么样的支付方式问卷录入数据.sav??MISSING(B4

文档评论(0)

heroliuguan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档