- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商务智能实验8报告概要
《数据挖掘与商务智能实验》
实 验 报 告
实验题目: 关联分析:关联规则
姓名: 王俊
学号: 201430850164
指导教师: 张大斌
实验时间: 2016.11.09
2016年 11 月 12 日
实验8 关联分析:关联规则
实验目的
了解和熟悉SPSS Modeler及其相关知识;
掌握SPSS Modeler工具建立Apriori关联规则的方法;
学会运用SPSS Modeler关联规则进行相关的内容分析。
实验内容
本实验分析的是超市顾客个人信息和他们的一次购买商品数据,采用的是关联分析中的Apriori算法。本实验的数据来自文件名为BASKETS.txt的文件。数据的主要内容包括两个部分,第一部分是顾客的个人信息,主要变量有会员卡号(cardid)、消费金额(value)、支付方式(pmethod)、性别(sex)、是否业主(homeown)、年龄(age)、收入(income);第二部分是顾客的一次购买商品的信息,主要变量有果蔬(fruitveg)、鲜肉(freshmeat)、奶制品(dairy)、罐头蔬菜(cannedveg)、罐头肉(cannedmeat)、冷冻食品(frozenmeal)、啤酒(beer)、葡萄酒(wine)、软饮料(softdrink)、鱼(fish)、糖果(confectionery),均为二分类型变量,取值T表示购买,F表示未购买,是一种事实表的数据组织格式。本次试验分析的是的哪些商品最有可能购买。具体实验步骤如下:
实验步骤与结果
步骤1 创建Apriori算法数据流
(1)通过“可变文件”节点读入数据BASKETS.txt。
(2)选择建模卡片中的“Apriori”节点并将其简洁到数据中的恰当位置,点击鼠标,选择菜单中的编辑选项进行参数设置。
步骤2 设置具体参数
(1)在“字段”下,选择“使用定制设置”选项。在“后项”和“前项”框中选择关联规则的后项和前项的变量,本例中分析连带销售商品,因此所有商品均被选入后项和前项。如图8-1(a)所示。
图8-1(a)
(2)在“类型”下,制定当前前项最低条件支持度,默认值10%;最小规则置信度,默认值为80%;最大前项数,默认为5;勾选“仅包含标志变量的真值”,表示只显示项目出现的规则,而不显示项目不出现时的规则,这里关心的是商品的连带购买。如图8-1(b)所示。
图8-1(b)
(3)在“专家”的选项下,选择模式“专家”选项,并选择评价关联规则的度量指标,这里选择默认选项“规则置信度”。如图8-2所示。
图8-2
步骤3 结果运行
实验结果如图8-3所示。
结果说明,如按第2条关联规则,购买啤酒和冷冻食品则会同时购买罐头蔬菜,样本中购买啤酒喝冷冻食品的样本为170;同样也说明购买啤和冷冻食品的顾客有85.882%的可能购买罐头蔬菜,该规则的支持度为14.6%。本例中产生了三条关联规则:啤酒和罐头蔬菜→冷冻食品(S=14.6%,C=87.452%);啤酒和冷冻食品→罐头蔬菜(S=14.6%,C=85.882%);冷冻食品和罐头蔬菜→啤酒(S=14.6%,C=84.393%)。同时三条关联规则的提升度(2.895,2.834,2.88)都可以接受。因此,啤酒、罐头蔬菜、冷冻食品是最可能连带销售的商品。
可以利用关联规则考察哪类和顾客符合哪条关联规律。如果顾客满足某条关联规则,则可以推断其有一定可能性同时购买某种商品,反之,则无法预测。
步骤4 考察关联规律
(1)将Apriori节点中的模型计算的结果添加到数据流编辑区域的恰当位置。
(2)点击鼠标右键选择“编辑”选项,进行“选项”的设置。
(3)“最大预测数”中输入数值,默认为3.
(4)勾选“忽略不匹配篮项目”,表示样本应用规则时不能按照顺序完全匹配前项的所有项目时,允许采用非精度匹配。勾选“检查预测不在篮中”,表示样本应用关联规则时,给出的后项结果不应出现在前项。如图8-4所示。
图8-4
通过“表”节点课观察具体的结果。$A、$AC、$A-Rule表示每个样本应用关联规则的推测结果、置
您可能关注的文档
- 品牌文化及岗位职责(2014版)概要.ppt
- 哥尼斯堡七桥问题概要.ppt
- 唐前文学史概要.doc
- 唐山中邦液氧储罐泄漏事故2015概要.doc
- 唐朝的达官贵人概要.ppt
- 哲学生活之世界是永恒发展的概要.ppt
- 唐诗宋词理解性名句默写概要.ppt
- 唤醒、焦虑与运动表现概要.ppt
- 售前客户服务与管理概要.ppt
- 售前支持技巧及售前方案编写要点概要.ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 2025年高考数学模拟卷(四)含答案及解析.pdf VIP
- 急性呼吸循环衰竭的早期识别与救治(共88张PPT)【88页】.pptx VIP
- 2023年河南省普通高校对口招生考试电子类专业课试卷.pdf VIP
- 院感及院感管理的基本概念.ppt VIP
- 维生素d3与骨骼健康课件.ppt
- 重点项目信息管理平台建设方案.docx
- 2025年高考数学模拟卷(三)含答案及解析.pdf VIP
- 河师大焦争鸣张万琴版线性代数答案解析.pdf VIP
- Unit4NaturalDisastersListeningandSpeaking课件高中英语人教版22.pptx
- 接受人生的荒谬是强大还是懦弱的表现?辩论赛 正方辩词一辩、二辩、三辩、四辩发言稿.docx
文档评论(0)