- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS在数据挖掘中的应用
第16章 SPSS在数据挖掘中的应用 16.1 实例提出:168信息点播业务 数据16-1.sav是某月陕西主要地区各类业务的流量数据,数据16-2.sav是该月每天各类业务的流量数据。请利用这些资料分析以下问题: 问题一:请分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。 问题二:请指出该月点播业务最好三项栏目,并分析它们之间的流量有无显著性差异。 问题三:请预测该月点播业务最好栏目的长期发展趋势。 16.2 实例的SPSS软件操作详解 问题一操作详解 问题一要求分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。由于各地区在股票点播、指数点播等业务上的流量数据差异较大,并没有统一的大小顺序关系,因此可以采用聚类分析研究陕西各地区的总流量差异。 问题一操作详解 Step01:打开数据文件及对话框 打开数据文件16-1sav,选择菜单栏中的【Analyze(分析)】→【Classify(分类)】→【Hierarchical Cluster(系统聚类)】命令,弹出【Hierarchical Cluster Cluster Analysis(系统聚类分析)】对话框。 Step02:选择聚类分析变量 在左侧的候选变量列表框中选择西安、宝鸡、榆林等十个地区变量设定为聚类分析变量,将其添加至【Variables(变量)】列表框中。同时点选【Variable(变量)】单选钮,表示选择聚类对象为指标变量。 Step03:输出聚类数目 在主对话框中单击【Statistics】按钮,弹出相应对话框。点选【Single solution(单一方案)】单选钮,并在【Number of clusters(聚类数)】文本框中键入数字“3”表示利用聚类分析将十个地区分为三类。其他选项保持系统默认,单击【Continue】按钮返回主对话框。 问题一操作详解 Step04:输出聚类图 在主对话框中单击【Plots】按钮,弹出【Plots(绘制)】对话框。勾选【Dendrogram(树状图)】复选框,表示输出样品的聚类树形图。其他选项保持系统默认,单击【Continue】按钮返回主对话框。 Step05:聚类方法选择 在主对话框中单击【Method】按钮,弹出【Method(方法)】对话框。在【Transform Values(转换值)】选项组的【Standardize】下拉菜单中选择【Z scores(Z得分)】标准化方法。其他选项保持系统默认,单击【Continue按】钮返回主对话框。 Step06:单击【OK】按钮,完成操作。 问题一操作详解 问题二操作详解 Step01:计算各项业务的日平均流量 打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】 →【Compare Means(比较均值)】→【Means(均值)】命令,弹出【Means(均值)】对话框。在左侧的候选变量列表框中选择“股票点播”、“指数点播”等业务。其他选项保持系统默认,单击【OK】按钮完成操作。 接着根据输出的业务流量统计数据表16-2.sav,可以确定日平均流量最大的三项业务“股票点播”、“每日运程”和“劲爆笑话”为点播业务最大的业务。 问题二操作详解 问题二操作详解 Step02:业务流量的差异性研究 选择菜单栏中的【Analyze(分析)】 →【Nonparametric Tests(非参数检验)】→【Legacy Dialogs(旧对话框)】→【K Related Samples(K个相关样本)】命令,弹出【Tests for Sevearl Related Samples(多个关联样本检验)】对话框。在候选变量列表框中同时选择“股票点播”、“每日运程”和“劲爆笑话”变量作为配对检验变量,将其同时添加至【Test Variable(s)(检验变量)】列表框中。在【Test Type(检验类型)】选项组中勾选【Friedman】复选框作为配对样本检验的方法。最后单击主对话框中的【OK】按钮,完成操作。 问题二操作详解 问题三操作详解 Step01:绘制序列图 打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】 →【Forecasting(预测)】→【Sequence Charts(序列图)】命令,弹出【Sequence Charts(序列图)】对话框。在左侧的候选变量列表框中选择“股票点播”进入右侧的【Variables(变量)】列表框。其他选项保持系
您可能关注的文档
- newch6 中断系统.ppt
- newch7 可编程定时计数器8253.ppt
- newch8 接口电路.ppt
- NGC公司绩效管理体系设计.ppt
- NO1数控机床加工程序编制基础2.ppt
- NPS训练教材.ppt
- NT-3神经生长因子-3.doc
- NX75基准特征.ppt
- NX75同步建模.ppt
- NX75孔凸台凸垫和型腔特征.ppt
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
最近下载
- 2024年刑法知识考试题库及答案【基础+提升】.pdf VIP
- 支气管镜诊疗操作相关大出血的预防和救治专家共识.pdf
- 2022年太原理工大学计算机科学与技术专业《操作系统》科目期末试卷B(有答案).docx VIP
- 2023年太原理工大学计算机科学与技术专业《操作系统》科目期末试卷B(有答案).docx VIP
- PP板_MSDS.doc
- 土木工程识图9剖面图和断面图.ppt
- 2024届高三英语一轮复习:说题比赛 ---2021年新高考II卷语法填空课件.pptx VIP
- 长输管道施工组织方案.doc
- 大职赛生涯闯关参考答案.docx VIP
- AST_中央企业班组长岗位管理能力资格认证(三期模拟1030)-0019.pdf
文档评论(0)