网站大量收购独家精品文档,联系QQ:2885784924

消费响应预测模型.pptxVIP

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲:消费者响应预测模型主讲:梁满发数据挖掘工作意图 数学挖掘工作意图是揭示海量数据中的隐蔽规律,以预测目标顾客、风险控制、欺诈模式识别等工作为主要目的。做好数据挖掘工作需要准备好三件事:(1)定义好问题 ……谁是目标消费者? (2)高质量的历史数据 ……几年的客户购买记录 (3)一个强大的建模工具 ……数据挖掘软件数据挖掘工作流程建模模型评估定义问题抽样定义数据属性预测或计算得分数据探测数据清冼分析报告问题背景 假如你为一个邮购公司工作。公司为了配合销售活动,希望每月发送家具和家用器品产品目录给潜在消费者,内容包括厨房用具、碗碟和餐具产品的目录。假如向全部消费者寄送费用太贵,必须选择购买该类产品概率较大消费者邮寄。现在如何确定一份待邮寄名册?我们将通过建立消费倾向模型,使用数据挖掘工具来确定邮寄名单和分析活动效益情况。  假如你有一个珍贵的顾客购买记录数据。这个数据包括能显示顾客过去两年是否购买过厨房用具、碗碟和餐具等信息。数据文件名为CUSTDET1,它包括了如下49个变量和标签: His/Her ApparelJewelry PurchaseDate 1st OrderTelemarket Order Account NumberState CodeRaceHeating TypeNumber of CarsNumber of KidsTravel TimeEducation LevelJob Category PurchaseDollars SpentYearly IncomeHome ValueOrder FrequencyRecencyMarriedName PrefixAgeSex Telemarket Ind.Rents ApartmentOccupied 1 Year Domestic ProductApparel PurchaseLeisure ProductLuxury ItemsKitchen ProductDishes PurchaseFlatware Purchase Total Dining (kitch+dish+flat)Promo: 1-7 MonthsPromo: 8-13 Months$ Value per MailingCountry CodeTotal ReturnsMens ApparelHome FurnitureLamps PurchaseLinens Purchase Blankets PurchaseTowels PurchaseOutdoor ProductCoats PurchaseLadies CoatsLadies Apparel分析问题目标:(1)在没有购买记录的客户名册中找出待邮寄名单;(2)以投资回报率或最大利润为决策目标,决定邮寄名单。解决问题的条件:(1)目标变量是什么?有足够的数据资料吗?(2)有与目标关联的数据资料吗?关联性如何?(3)资料的完整性、可靠性和冗余情况?(4)研究路线设想?(5)有什么期待? 因为对目录中产品有需求的客户是购买了kitch、dish和flat叁类产品的客户,在我们的数据记录中kitch、dish、flat和Dining变量反映了客户购买信息。但Dining变量表示kitch、dish、flat购买量和,我们分析目标是分析客户有没有购买kitch、dish、flat商品的意向,因此,我们的目标变量是“当Dining变量>0,值为1,表示购买;否则为0,表示不购买”。同时kitch、dish、flat和Dining变量不能作为预测目标变量自变量,因为它们是共线性的。 我们的数据是由更大的客户数据库中用重抽样法抽取的,为了有足够的样本做建模分析,使Dining变量响应值(即为1的值)在样本中的比例近54%,这与现实中客户比例不合。因此,在建模中我们需要调整样本的权重,现实中响应比例是12%。 抽样数据观察记录为1996个,作为统计推断和建模分析精度足够,数据没有缺损值,完整性好。没有太多的齐异数据,基本可认为数据可靠。通过数据的探索分析,可以发现有变量同目标变量存在相关性,因此,可以考虑通过建立目标变量与其它变量的回归模型、决策树模型和神精网络模型来预测目标变量。相关系数 BLANKETSDININGBLANKETS1DINING0.3494261创建数据挖掘项目调用SAS数据挖掘功能 创建数据挖掘项目 创建数据挖掘流程在Dining List中选择Untitled,并输入Propensity名。 工具窗报告窗按扭流程图分割数据集设置数据属性缺损值处理输入数据数据变换决策树模型分析报告 数据挖掘的第一步就是确定样本数据,数据的角色,变量的模型中角色和数据类型。一般来说,用户数据仓库中的数据可能是海量的,如果全部用来建模分析,则

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档