- 1、本文档共80页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第四章 关联规则分析
第一节关联规则的理论与算法第二节关联规则分析的python实践第三节案例分析目录
第一节关联规则的理论与算法
一、关联的内涵二、关联规则分析的主要内容三、关联规则分析的算法主要内容
(一)定义关联其实就是相关性,简单地说,若一个现象变化,另一现象随之变化,我们就认为这两种现象之间是相关的。(二)典型应用1.啤酒与纸尿裤2.房屋价格与地理位置一、关联的内涵
(一)定义关联规则分析又称关联挖掘、购物篮分析,反映一个事物与其他事物之间的相互依存性和关联性,是数据挖掘的一个重要技术,用于从大量数据中挖掘出有价值的数据项之间的相关关系。(二)作用1.最早是为了发现超市销售数据库中不同的商品之间的关联关系。2.根据所挖掘的关联关系,可以从一个属性的信息来推断另一个属性的信息。当置信度达到某一阈值时,可以认为规则成立。二、关联规则分析的内涵
(三)应用场景1.互联网推荐个性化推荐:在界面上给用户推荐相关商品组合优惠券:给购买过的用户发放同时购买组合内商品的优惠券捆绑销售:将相关商品组合起来销售2.线下店铺分析商品配置分析:哪些商品可以一起购买,关联商品如何陈列、促销客户需求分析:分析顾客的购买习惯、顾客购买商品的时间、地点等二、关联规则分析的内涵
(三)应用场景3.金融保险经由购物篮分析能够设计不同的服务组合以扩大利润;能借由购物篮分析侦测出可能不寻常的投保组合并作预防。4.风控领域分析同时行动的账号、寻找有效的策略组合。二、关联规则分析的内涵
三、关联规则分析的算法算法名称算法描述Apriori关联规则最常用、最经典的挖掘频繁项集的算法,核心思想是通过连接产生候选项及其支持度,然后通过剪枝生成频繁项集。无法处理连续型数值变量,往往分析之前需要对数据进行离散化。FP-Tree针对Apriori算法固有的多次扫描事物数据集的缺陷,提出的不产生候选频繁项集的方法。Apriori和FP-Tree都是寻找频繁项集的算法。Eclat算法一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将有哪些信誉好的足球投注网站空间划分为较小的子空间。灰色关联法分析和确定各因素之间的影响程度,或是若干个子因素(子序列)对主因素(母序列)的贡献度而进行的一种分析方法。
输入:一组人的交易清单每一笔交易(transaction)包含一系列的商品(items)(一)Apriori算法的输入与输出三、关联规则分析的算法Aprior算法一笔交易(transaction)两种商品(items)面包牛奶订单编号(ID)购买商品(Items)1面包,牛奶2面包,纸尿裤,啤酒,鸡蛋3牛奶,纸尿裤,啤酒,可乐4面包,牛奶,纸尿裤,啤酒5面包,牛奶,纸尿裤,可乐表1交易清单
输入:一组人的交易清单每一笔交易(transaction)包含一系列的商品(items)(一)Aprior算法的输入与输出三、关联规则分析的算法Aprior算法一笔交易(transaction)四种商品(items)面包牛奶啤酒鸡蛋订单编号(ID)购买商品(Items)1面包,牛奶2面包,纸尿裤,啤酒,鸡蛋3牛奶,纸尿裤,啤酒,可乐4面包,牛奶,纸尿裤,啤酒5面包,牛奶,纸尿裤,可乐表1交易清单
输入:一组人的交易清单每一笔交易(transaction)包含一系列的商品(items)(一)Aprior算法的输入与输出三、关联规则分析的算法Aprior算法一共有5笔交易(transaction)涉及到6种商品(items)订单编号(ID)购买商品(Items)1面包,牛奶2面包,纸尿裤,啤酒,鸡蛋3牛奶,纸尿裤,啤酒,可乐4面包,牛奶,纸尿裤,啤酒5面包,牛奶,纸尿裤,可乐表1交易清单
输入:一组人的交易清单每一笔交易(transaction)包含一系列的商品(items)(一)Aprior算法的输入与输出三、关联规则分析的算法Aprior算法订单编号(ID)购买商品(Items)1面包,牛奶2面包,纸尿裤,啤酒,鸡蛋3牛奶,纸尿裤,啤酒,可乐4面包,牛奶,纸尿裤,啤酒5面包,牛奶,纸尿裤,可乐表1交易清单ID面包牛奶纸尿裤啤酒鸡蛋可乐12345表2二进制表示的交易清单若购买了某种商品,则取值1;若未购买某种商品,则取值为0111111111111111111000000000000软件中稀疏矩阵(SparseMatrix)用稀疏矩阵表示的商品交易清单
输出(一)Aprior算法的输入与输出三、关联规则分析的算法Aprior算法频繁项集关联规则满足最小支持度的所有项集高置信度的关联规则(rules)
1.项集:包含0个或多个项的集合被称为项集(itemset)。K项集:如果一个项集包含k个项,则称它为k项集。空集:是指不包含任何项的项集。(二)
您可能关注的文档
- 《python金融大数据分析》课件——任务三 Python标准库爬取金融数据.pptx
- 《python金融大数据分析》课件——任务四 Python网页文本数据库爬取金融数据.pptx
- 《python金融大数据分析》课件——第三章 数值特征及其应用.pptx
- 《python金融大数据分析》课件——金融数据可视化.pptx
- 大学生职业规划(图文并茂).docx
- 大学生职业生涯规划的影响因素及原因探讨.docx
- 大学生毕业实习总结2025年模版(3).docx
- 大学毕业生登记表的自我总结范文(通用7).docx
- 大学生职业生涯规划需求现状及影响因素研究【开题报告】.docx
- 多层框架结构厂房设计及超限问题分析.docx
文档评论(0)